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VerdfTentlicht 

Mil internationalem Recherche nbericht. 

Vor Ablauf der fur Anderungen der Anspruche zugelassenen 
Frist. Veroffentlichung wird wiederholt falls Anderungen 
eintreffen. 

(88) Veroflentlichungsdatum des internationalen Recherchenbe- 
richts: 13. April 2000 (13.04.00) 



(54) Title: MODULARLY CONSTRUCTED RNA MOLECULES HAVING TWO SEQUENCE REGION TYPES 
(54) Bezeichnung: MODULAR AUFGEBAUTE RNA-MOLEKOLE MIT ZWEI SEQUENZBEREICHSTYPEN 



(57) Abstract 

The invention relates to modularly constructed RNA molecules which can bind to a ligand and which are characterized by two 
sequence regions. Said first sequence region contributes to the maintenance of the three-dimensional structure of the RNA molecule, and a 
second sequence region is responsible for the specific bond of the ligand. These RNA molecules, e.g. the NINTROX-RNA, can be used for 
directly influencing the gene expression. The invention also relates to vectors containing the inventive RNA molecules, to medicaments and 
diagnostic compositions which contain said RNA molecules or vectors, to an antibody which specifically recognizes these RNA molecules 
or antisense RNA which specifically binds to these RNA molecules, or to ribozymes which split these RNA molecules. In addition, the 
invention relates to non-human mammals whose NINTROX gene is modified by inserting a heterologous sequence and to the cells obtained 
therefrom. 



(57) Zusammenfassung 

Beschrieben werden modular aufgebaute RNA-Molekule, die an einen Liganden binden konnen und durch zwei Sequenzbereiche 
gekennzeichnet sind, einen ersten Sequenzbereich, der zur Aufrechterhaltung der dreidimensionaien Struktur des RNA-Molekuls 
beitragt, und einen zweiten Sequenzbereich, der fur die spezifische Bindung des Liganden verantwortlich ist Diese RNA-Molekule, 
beispielsweise die NINTROX-RNA konnen zur direkten Beeinflussung der Genexpression verwendet werden. Beschrieben werden 
ferner die erfindungsgemSssen RNA-Molekule enthaltende Vektoren sowie Arzneimittel und diagnostische Zusammensetzungen, die die 
vorstehenden RNA-Molekule bzw, Vektoren enthalten, ein diese RNA-Molekule spezifisch erkennender Antikdrper bzw. spezifisch 
an diese RNA-Molekule bindende Antisense-RNA oder diese RNA-MolekGle spaltende Ribozyme. Ausserdem betrifft die Erfindung 
nichtmenschliche Sauger, dercn NINTROX-<3en durch Insertion eincr heterologen Sequenz verandert ist und daraus erhaltene Zellen. 



VERTRA ER DIE INTERNATIONALE ZU J^MENARBEIT 

AUF DEM GEBIET DES PATENTWESENS 



Absender INTERNATIONALE RECHERCHENBEHORDE 



An 

SCHUSSLER Andrea 
Truderinger Str. 246 
D-81825 Miinchen 



PCT 



MITTEILUNG UBER DIE UBERMITTLUNG DES 
INTERNATIONALEN RECHERCHENBERICHTS 
ODER DER ERKLARUNG 

(Regel 44.1 PCT) 





Absendedatum 

(TagMonat/Jahr) 28/02/2000 


Aktenzeichen des Anmelders Oder Anwalts 

K 2690 - sch/msl 


WEITERES VORGEHEN siehe Punkte 1 und 4 unten 


Internationales Aktenzeichen 

PCT/DE 99/01867 


Internationales Anmeldedatum 
(Tag/Monat/Jahr) 25/06/1999 


Anmelder 

DEUTSCHES KREBSFORSCHUNGSZENTRUM. . . et al . 



1 . Dem Anmelder wird mitgeteilt, daB der Internationale Recherchenbericht erstellt wurde und ihm hiermit ubermittett wird. 
Elnreichung von Anderungen und einer Erklarung nach Artikel 19: 

Der Anmelder kann auf eigenen Wunsch die Anspruche der intemationalen Anmeldung andern (siehe Regel 46): 

Bis wann sind Anderungen einzureichen? 

Die Frist zur Einreichung solcher Anderungen betragt ublicherweise zwei Monate ab der Ubermittlung des 
intemationalen Recherchenberichts; weitere Einzelheiten sind den Anmerkungen auf dem Beiblatt zu entnehmen. 

Wo sind Anderungen einzureichen? 

Unmittelbar beim Intemationalen Buro der WIPO, 34, CHEMIN des Coiombettes, CH-121 1 Genf 20, 
Telefaxnr.: (41-22) 740.14.35 

Nahere Hinweise sind den Anmerkungen auf dem Beiblatt zu entnehmen. 

2. [~~] Dem Anmelder wird mitgeteilt daB kein internationaler Recherchenbericht erstellt wird und daB ihm hiermit die Erklarung nach 

Artikel 17(2)a) ubermrttelt wird. 



Hinsichtlich des Widerspruchs gegen die Entrichtung einer zusatzlichen Gebuhr (zusatzlicher Gebuhren) nach Regel 40.2 wird 
dem Anmelder mitgeteilt daB 

□ der Widerspruch und die Entscheidurig hieruber zusammen mit seinem Antrag auf Ubermittlung des Wortlauts sowohl des 
Widerspruchs als auch der Entscheidung hieruber an die Bestimmungsamter dem Intemationalen Buro ubermittett worden 
sind. 

□ noch keine Entscheidung uber den Widerspruch vorliegt; der Anmelder wird benachrichtigt, sobald eine Entscheidung 
getroffen wurde. 

4. Wei teres Vorgehen: Der Anmelder wird auf foigendes aufmerksam gemacht: 

Kurz nach Ablauf von 18 Monaten seit dem Prioritatsdatum wird die Internationale Anmeldung vom Intemationalen Buro veroffen|r 
licht. Wtllder Anmelder die Veroffentiichung verhindern Oder auf einen spateren Zeitpunkt verschieben, so mu3 gemaB Regel 90 .1 
bzw. 9(T?3 vor AbschluB der technischen Vorbereitungen fur die internationale Verdffentlichung eine Erklarung uber die Zurucknah- 
me der intemationalen Anmeldung Oder des Priori tatsanspruchs beim Intemationalen Buro eingehen. 

Innerhalb von 19 Monaten seit dem Prioritatsdatum ist ein Antrag auf internationale vortaufige Prufung^ einzureichen, wenn der 
Anmelder den Eintritt in die nationale Phase bis zu 30 Monaten sett dem Prioritatsdatum (in manchen Amtern sogar noch langer) 
verschieben mochte. 

Innerhalb von 20 Monaten seit dem Prioritatsdatum muB der Anmelder die fur den Eintritt in die nationale Phase vorgeschriebenen 
Handlungen vor alien Bestimmungsamtern vomehmen. die nicht innerhalb von 19 Monaten seit dem Prioritatsdatum in der 
Anmeldung Oder einer nachtraglichen AuswahlerkJarung ausgewahlt wurden Oder nicht ausgewahlt werden konnten, da fur sie 
Kaprtel II des Vertrages nicht verbindlich ist. 





Name und Postanschrift der Intemationalen Recherchenbehdrde 
^ Europaisches Patentamt, P.B. 5818 PatentJaan 2 
^Jfrt NL-2280 HV Rijswijk 

WJI Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 


Bevollmachtigter Bediensteter 

Chantal Meyer 



Formblatt PCT/ISA/220 (Juli 1 998) (Siehe Anmerkungen auf Beiblatt) 
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• 

ANMERKUNGEN ZU FORMBLATT PCT/ISA/220 



Diese Anmerkungen soften grundlegende Htnweiae zur Einreichung von Anderungen gem&B Artikel 1 9 geben. Diosen Anmerkungen - 
Itegen die Erforderrusse des Vert rag 3 Ober cfie intemationale Zusammenarbett auf dom Gebiet des Patontweaens (PCT), der Ausfuhrungs- 
ordnung und dor Veiwaftungsrichtlinien zu diesem Vertrag zugrunde. Bei Abwetchungen zwischen cfiesen Anmerkungen und 
obengenannten Texten sind letztere maBgebend. Nahere Einzelherten sind dem PCT-Leitfaden fur Anmelder, einer Ver6ffentfichung der 
WIPO, zu entnehmen. 

Die in dies on Anmerkungen verwendeten Beg riff e "Artikel", "RegeP und "AbschnitT beziehen sich jeweils auf cfie Bestimmungen des 
PCT-Vertrags, der PCT-Ausnjhrungsordnung bzw. der PCT-Verwaftungsrichtfinien. 

hinweise zu Anderungen gemAss artikel 19 

Nach Erhaft des intemationalen Recrterchenberichts hat der Anmetder die M6g!ichkert, eirtmaJ die AnsprOche der international en 
Anmeldung zu an dem. Ea tat jedoch zu betonen, daB, da alle Teile der intemationaien Anmeldung (AnsprOche, Beschretbung und 
Zetchnungen) wahrend des alternation alen voriaufigen PrQfungsverfahrens geandert warden k6nnen, normaJerwetse ketne Notwendigkeit 
besteht, Anderungen der AnsprOche nach Artikel 1 9 einzureichen, auBer wenn der Anmelder z.B. zum Zwecke eines voriaufigen 
Sohutzes die Veroffentlichung cfieser Anspruche wGnscht oder ein anderer Grund fOr etne Anderung der AnsprOche vor ihrer tntemationa- 
len Veroffentlichung vorltegt. Weiterhin tst zu beachten, daB ein vorlaufiger Schutz nur in eintgen Staaten erhajtfich ist. 



Wet che Telle der Intemationalen Anmeldung konnen geandert werden? 

Im Rahman von Artikel 19 konnen nur die Anspruche geandert werden. 

In der intemationalen Phase k6nnen die Anspruche auch nach Artikel 34 vor der mit der tntemationalen voriaufigen PrOfung beauf 
tragten Be horde geandert (oder nochmals geandert) werden. Die Beschretbung und cfie Zetchnungen k6nnen nur nach Artikel 34 
vor der mit der international en voriaufigen PrOfung beauftragten Behorde geandert werden. 

Beim Eintritt in die nationaJe Phase kGnnen aile Teile der tntemationalen Anmeldung nach Artfcei 28 oder gegebenenfalls Artikel 
41 geandert werden. 



Bis wann sind Anderungen einzureichen? 

Innerhalb von zwei Monaten ab der Obermrttlung des intern ationalen Recherchenberichts oder innerhalb von sechzehn M on at en ab 
dem Priori t at adatum, je nach dem, wetche Frist sp&ter ablauft. Die Anderungen getten jedoch als reohtzettig eingereicht, wenn aie 
dem tntemationalen Buro nach Ablaut der maBgebenden Frist, aber noch vor AbschluS der technischen Vorberertungen fOr cfie 
intemationale Veroffentiichung (RegeJ 46.1) zugehen. 



Wo sind die Anderungen nleht einzureichen? 

Die Anderungen k&rtnen nur beim I ntemati on alen BOro, nicht aber beim Anmeldeamt oder der IntemationaJen Fie cherchenbe horde 
eingereicht werden (Regel 46.2). 

Falls ein Antrag auf intemationale voriauftge PrOfung eingereicht wurde/wird, siehe urtten. 

In welcher Form konnen Anderungen erfotgen? 

Eine Anderung kann erfolgen durch Streichung eines oder mehrerer ganzer AnsprOche, durch HinzufOgung eines oder mehrerer 
neuer AnsprOche oder durch Anderung des Wortiauts eines oder mehrerer AnsprOche in der eingereicht en Fassung. 

FOr jedea Anspruch&blatt, das sich auf grund einer oder mehrerer Anderungen von dem ursprOnglich eingereichten Blatt 
urrterscheidet, ist ein Ersatz blatt einzureichen. 

Alle AnsprOche, die auf etnem Ersatzblatt erscheinen, sind mit arabischen Ziffem zu numerieren. Wird ein Anspruch gestrichen, so 
brauchen, die anderen AnsprOche nicht neu numeriert zu werden. Im Fall einer Neunumerierung sind cfie AnsprOche fort! au fend zu 
numerieren (VerwaKungsrichttinien, Abschnitt 205 b)). 

Die Anderungen sind In dec Spraehe abzufassen, In der dielntematfonale Anmeldung verdtterrtllcht wird. 



Welche Untertagen sind den Anderungen beurufOgen? 
Beg lefts chrei ben (Abschnitt 205 b)): 

Die Anderungen sind mit einem BegleHschreiben einzureichen. 

Das Begleitschreiben wird nicht zusammen mit der intemationalen Anmeldung und den geandert en AnsprOchen veroffsntltcht. Es 
ist nicht zu verwechsetn mit der "Ertdarung nach Artikel 19(1)" (siehe urtten, "Erklarung nach Artikel 19 (1) - ). 

Das Begtettschreiben ist nach Wahl des Anmeiders In engfischer oder franzdsischer Spraehe abzufassen. Bel engllschspra- 
. chigen Intemationalen Anmeldungen ist das BeglelUchreiben aber ebenfalls In engllscher, bel franzoslschsprachlgen Inter- 
nationa ten Anmeldungen In franzdsischer Spraehe abzufassen. 




Anmerkungen zu Formblatt PC T71S A/220 (Blatt 1 ) (Januar 1 994) 




ANMERKUNGEN ZU FORMBLATT PCT/ISA/220 (Fortsetzung) 



(m Begleitschreiben sind die Unterschiede zwischen den AnsprOchen in der eingereichten Fassung und den geanderten AnsprOchen 
anzugeben. So tst insbesondere zu jedem Anspruch in der intemationalen Anmetdung anzugeben (gteichlautende Angaben zu 
verschiedenen AnsprOchen kOnnen zusammengefaftt werden), ob 

i) der Anspruch unverandert ist; 

ii) der Anspnjch gestrichen worden ist; 
iii") der Anspruch neu tst; 

rv) der Anspruch einen oder mehrere AnsprOche in der eingereichten Fassung ersetzt; 

v) der Anspruch auf die Tetlung eines Anspruchs in der eingereichten Fassung zurGckzufuhren ist. 



Im folgenden sind Belsptete angegeben, wle Anderungen Im Beglettxshrelben zu eriautem sind: 

1. [Wenn ansteOe von ursprQng&ch 48 AnsprOchen nach der Anderung einiger AnsprOche 51 AnsprOche existieren]: 

"Die AnsprOche 1 bis 29, 31 , 32, 34, 35, 37 bis 48 werden durch geanderte AnsprOche gteicher Numerierung ersetzt; AnsprOche 
30, 33 und 36 unverandert; neue AnsprOche 49 bis 51 hinzugefQgt* 

2. [Wenn anstelle von ursprOngKch 1 5 AnsprOchen nach der Anderung alter AnsprOche 1 1 AnsprOche existieren]: 
"Geanderte AnsprOche 1 bis 1 1 treten an die SteUe der AnsprOche 1 bis 1 5." 

3. [Wenn ursprungltch 14 AnsprOche existierten und die Anderungen darin bestehen, da6 eirrige AnsprOche gestrichen werden und 
neue AnsprOche hinzugefQgt werden]: 

AnsprOche 1 bis 6 und 1 4 unverandert; AnsprOche 7 bis 1 3 gestrichen; neue AnsprOche 15, 1 6 und 1 7 hinzugefOgt.'Oder" An- 
sprOche 7 bis 13 gestrichen; neue AnsprOche 15, 16 und 17 hinzugefQgt; alte Q brig en AnsprOche unverandert* 

4. [Wenn verschiedene Art en von Anderungen durchgefBhrt werden]: 

"AnsprOche 1-10 unverandert; AnsprOche 11 bts 13, 18 und 19 gestrichen; AnsprOche 1 4, 15 und 16 durch geanderten An- 
spruch 14 ersetzt; Anspruch 17 in geanderte AnsprOche 15, 16 und 17 unterteitt; neue AnsprOche 20 und 21 hinzugefQgt * 



"Eridarung nach Artikel 19(1)" (Regef 46.4) 

Den Anderungen kann eine Eridarung beigefOgt werden, mit der cSe Anderungen erlautert und ihre Auswirkungen auf die 
Beschreibung und die Zeichnungen dargelegt werden (die nicht nach Artikel 1 9 (1) geandert werden konnen). 

Die EridSrung wird zusammen mit der intemaiionaJen Anmeldung und den geanderten AnsprOchen verofferrtiicht 
Sle 1st In der Sprache abztxfassen, In der die internatfonaien Anmeldung vwoffentllcht wird, 

Sie muB kurz g eh arte n sein und darf, wenn in engJtsoher Sprache abgefaBt oder ins Englsche Obersetzt, nicht mehr ais 500 
Worter umfassen 

Die Erkiarung ist nicht zu verwechsetn mit dem Begteitschreiben, das auf die Unterschiede zwischen den AnsprOchen in der 
eingereichten Fassung und den geanderten AnsprOchen hinweist, und ersetzt tetzteres nicht. Sie ist auf einem gesonderten Blatt 
einzureichen und in der Gberschrift als sdche zu kennzeichnen, vorzugsweise mit den Worten "Eridarung nach Artikel 19 (1)". 

Die Erkiarung darf ketne herabsetzenden AuBerungen Qber den inter natkmaJen Recherchenbericht oder die Bedeutung von in dem 
Bericht angefOhrten VerofTentlichungen enthatten. Sie darf auf im intemationalen Recherchenbericht angefOhrte Veroffenttichun- 
gen, die sich auf einen bestimmten Anspruch beziehen, nur im Zusammenhang mit einer Anderung dieses Anspruchs Bezug 
nehmen. 



Auswirkungen eines bereits gesteitten Ant rags auf intemattonalevorliufige PrQfung 

Ist zum Zeitpunkt der Einreichung von Anderungen nach Artikel 19 bereits etn Antrag auf Internationale voriaufige PrQfung 
gestetlt worden, so sollta der Anmelder in sein em Inters see gfeichzeittg mit der Einreichung der Anderungen beim Intern ation alen 
Bflro auch eine Kopie der Anderungen bei der mit der intemationalen voriauftgen PrOfung beauftragen Be horde einreichen (siehe 
Regel 62.2 a), erster Satz). 



Auswirkungen von Anderungen hlnslchtlich der Obersetzung derintematfonalen Anmeldung beim Eintrttt In die 
nationals Phase 

Der Anmelder wird darauf hingewiesen, daB bei Eintritt in ale nation ale Phase moglicherweise an start oder zus&tzlich zu der Ober- 
setzung der AnsprOche in der eingereichten Fassung eine Obersetzung der nach Artikel 19 geanderten AnsprOche an cfie 
bestirnrnten/ausgewahtten Amter zu Obermitteln ist. 

Nahere Einzelheiten Qber die Erfordemisse jedes bestimmten/ausgewahlten Amts sind Band II des PCT-Lettfadens fur Anmelder 
zu entnehmen. 



Anmeriajngen zu Formblatt PCT/IS A/220 (Blatt 2) (Januar 1994) 



VERTRA 



ER DIE INTERNATIONALE EN ARBEIT 

AUF DEM GEBIET DES PATENTWESENS 

PCT 

INTERNATIONALER RECHERCHENBERICHT 

( Artikel 1 8 sowie Regeln 43 und 44 PCT) 



Aktenzeichen des Anmelders oder Anwalts 

K 2690 - sch/msl 


WEfTERES siehe Mitteilung uber die Ubermittlung des intemationalen 

Recherchenberichts (Formblatt PCT/ISA/220) sowie, soweit 
VORGEHEN zutreffend, nachstehender Punkt 5 


Internationales Aktenzeichen 

PCT/DE 99/01867 


Internationales Anmetdedatum 
(T ag/Monat/Jahr) 

25/06/1999 


(Fruhestes) Prioritatsdatum (Tag/Monat/Jahr) 

26/06/1998 


Anmetder 

DEUTSCHES KREBSFORSCHUNGSZENTRUM. . . et al . 



Dieser intemationale Recherchenbericht wurde von der Intemationalen Recherchenbe horde ersteltt und wird dem Anmelder gemaG 
Artikel 16 Obermittelt. Eine Kopie wird dem Intemationalen Buro ubermittelt 

Dieser intemationale Recherchenbericht umfaBt insgesamt _5 Blatter. 

|X| Dariiber hinaus liegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Technik bei. 



1. Grundlage des Berichts 

a. Hinsichtlich der Sprache ist die intemationale Recherche auf der Grundlage der intemationalen Anmeldung in der Sprache 
durchgefuhrt worden, in der sie eingereicht wurde, sofem unter diesem Punkt nichts anderes angegeben ist 



□ 



2. 
3. 



Die intemationale Recherche ist auf der Grundlage einer bei der Behorde eingereichten Ubersetzung der intemationalen 
Anmeldung (Regel 23.1 b» durchgefuhrt worden. 

b. Hinsichtlich der in der intemationalen Anmeldung offenbarten Nucleotid- und/oder Amlnosauresequenz ist die intemationale 
Recherche auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das 
[X| in der intemationalen Anmeldung in Schriflicher Form enthalten ist 

|~X~| zusammen mit der intemationalen Anmeldung in compute riesbarer Form eingereicht worden ist 

[ | bei der Behorde nachtragiich in schriftlicher Form eingereicht worden ist 

| | bei der Behorde nachtragiich in computeriesbarer Form eingereicht worden ist 

[X] Die Erklarung, daB das nachtragiich eingereichte schriftliche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
intemationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt 

(X| Die Erklarung, daB die in computeriesbarer Form erfaRten Informationen dem schriftlichen Sequenzprotokoll entsprechen, 
wurde vorgelegt 

| I Bestimmte Anspruche haben slch als nicht recherchierbar erwiesen (siehe Feld I). 
|X| Mangelnde Einheitlichkeit der Erfindung (siehe Feld II). 

Hinsichtlich der Bezeichnung der Erfindung 

[X| wird der vom Anmelder eingereichte Wortlaut genehmigt. 
| | wurde der Wortlaut von der Behorde wie folgt festgesetzt: 



5. Hinsichtlich der Zusammenfassung 

|Y1 wird der vom Anmelder eingereichte Wortlaut genehmigt. 

wurde der Wortlaut nach Regel 38 -2b) in der in Feld III angegebenen Fassung von der Behorde festgesetzt. Der 
[ | Anmelder karm der Behorde innemaJb eines Monats nach dem Datum der Absendung dieses intemationalen 

Recherchenberichts eine Stetlungnanme voriegen. 

6. Fdgende Abbildung der Zelchnungen ist mit der Zusammenfassung zu veroffentlichen: Abb. Nr. 



| | wie vom Anmelder vorgeschlagen | | keine der Abb. 

| | weil der Anmelder selbst keine Abbildung vorgeschlagen hat 
| | weil diese Abbildung die Erfindung besser kennzeichnet 



Formblatt PCT/1SA/210 (Biatt 1) (Juli 1998) 



PCT/DE 99/01867 



nternationales Aktenzeichen 

INTERNATIONALER RECHERCHENBERICHT 



Feld I Bemerkungen zu den Anspruchen, die sich als nicht recherchierbar erwiesen haben (Fortsetzung von Punkt 2 auf Blatt 1) 



GemaG Artikel 17{2)a) wurde aus folgenden Grunden fur bestimmte Anspruche kein Recherchenbericht erstellt: 
1 . | | Anspruche Nr. 

weil sie sich auf Gegenstande beziehen, zu deren Recherche die Behorde nicht verpflichtet 1st, namlich 



2. 1 | Anspruche Nr. 

weil sie sich auf Teile der intemationalen Anmeldung beziehen, die den vorgeschriebenen Anforderungen so wenig entsprechen, 
dafi eine sinnvoUe intemationaie Recherche nicht durchgefuhrt werden kann, namlich 



3. I | Anspruche Nr. 

weil es sich dabei um abhangige Anspruche handelt, die nicht entsprechend Satz 2 und 3 der Regel 6.4 a) abgefaBt sind. 



Feld II Bemerkungen bei mangelnder Einheitlichkeit der Erfindung (Fortsetzung von Punkt 3 auf Blatt 1) 



Die intemationaie Recherchenbehdrde hat festgestellt, daB diese Internationale Anmeldung mehrere Erfindungen enthalt: 

siehe Zusatzblatt 



1. 



I I Da der Anmelder alle erforderlichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat erstreckt sich dieser 
' 1 intemationaie Recherchenbericht auf alle recherchierbaren Anspruche. 



2 X Da Wr recherchierbaren Anspruche die Recherche ohne einen Arbeitsaufwand durchgefuhrt werden konnte, der eine 
' ' zusatzliche Recherchengebuhr gerechtfertigt hStte, hat die Behdrde nicht zur Zahlung einer solchen Gebuhr aufgefordert 



3. Da der Anmelder nur einige der erforderlichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat, erstreckt sich dieser 

" ' intemationaie Recherchenbericht nur auf die Anspruche. fur die Gebuhren entrichtet worden sind, namlich auf die 

Anspruche Nr. 



| | Der Anmelder hat die erforderlichen zusatzlichen Recherchengebuhren nicht rechtzeitig entrichtet. Der intemationaie Recher- 
chenbericht beschrankt sich daher auf die in den Anspruchen zuerst erwahnte Erfindung; diese ist in folgenden Anspruchen er- 
fafct 



Bemerkungen hinslchtlich elnes Widerspruchs | | Die zusatzlichen Gebuhren wurden vom Anmelder unter Widerspruch gezahlt 

| | Die Zahlung zusatzlicher RecherchengebQhren erfolgte ohne Widerspruch. 



Formblatt PCT/ISA/210 (Fortsetzung von Blatt 1 (1))(Juii 1998) 



Internationales AktenzeichenPCT/ DE 99/01867 



WEITERE ANGABEN PCT/iSA/ 210 



INTERNATIONAL A2ECHERCHENBERICHT 



I* 

I PCT 



ationales Aktenzeichen 

PCT/DE 99/01867 



A. KLASSIFIZIERUNG DES ANMELOUNGSGEGENST ANDES 

IPK 6 C12N15/11 C12N15/63 C12N5/10 C07K16/18 A61K39/395 
A61K48/00 A61K31/70 A01K67/027 

Nach der Internationalen PaterrtMassifikation (IPK) Oder nach der nationalen Klassifikation und der IPK 



B. RECHERCH1ERTE GEBIETE 



Recherchierter Mindestprufstoff (Klasstfikationssystem und Klassifikationssymbole ) 

IPK 6 C12N 



Recherchierte aber nicht zum Mindestprufstoff gehorende Veroffentlichungen, soweit diese unter die recherchierten Gebiete fallen 



Wan rend der InternationaJen Recherche konsuttierte elektronische Datenbank (Name der Datenbank und evtl verwendete Suchbegriffe) 



C. ALS WESENTLICH ANGESEHENE UNTER LAG EN 



Kategorie' 


Bezeichnung der Verdffentlichung, soweit erforderiich unter Angabe der in Betracht kommenden Teiie 


Betr. Anspruch Nr. 


X 


SEAGER ET AL. : "Introductory Chemistry. 


1,4,6 




General, Organic, Biological" 






1979 , SCOTT, FORESMAN AND COMPANY , 






GLENVIEW, ILLINOIS, CHAPTER 25.7 THE 






RNAS, SEITE 497-503, XP002130192 






Seite 499; Abbildung 25.14 




X 


REICHWALD ET AL.: "Homo sapiens 


1-8 




chromosome X, PAC 671D9, complete 






sequence" 






EMBL SEQUENCE DATABASE, 






6. April 1998 (1998-04-06), XP002130190 






HEIDELBERG DE 






Ac AF031078 






das ganze Dokument 






-/-- 





Weitere Veroffentlichungen sind der Fortsetzung von FekJ C zu 
entnehmen 



Siehe Anhang Patentfamilie 



* Be sonde re Kategorien von angegebenen Veroffentlichungen T' 

"A" Verofferrtiichung, die den allgemeinen Stand der Technik definiert. 
aber nicht als besonders bedeutsam anzusehen ist 

"E" alteres Dokument, das jedoch erst am Oder nach dem internationalen 

Anmeidedatum veroffentiicht worden ist » x - 

"L" Verdffentlichung, die geeignet ist, einen Prioritatsanspruch zweifelhaft er- 
scheinen zu lassen, Oder durch die das Veroffentlichungsdatum einer 
anderen im Recherche nbericht genannten Verofferrtiichung belegt werden -y 
soil Oder die aus einem anderen be sonde re n Grund angegeben ist (wie 
ausgefOhrt) 

"O" Verdffentlichung, die slch auf eine mundliche Offenbarung, 

eine Benutzung, eine Aussteltung Oder andere MaBnahmen bezieht 
"P" Verdffentlichung, die vor dem tntemationalen Anmeidedatum, aber nach -Jt , 



Spatere Verofferrtiichung, die nach dem internationalen Anmeidedatum 
Oder dem Prioritatsdatum veroffentiicht worden ist und mit der 
AnmeWung nicht koilidiert, sondem nur zum Verstandnts des der 
Erfindung zugrundeliegenden Prinzips oder der ihr zugrundeliegenden 
Theorie angegeben tst 

1 Verdffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann alleln auf grund dieser Verofferrtiichung nicht als neu Oder auf 
erfinderischer Tatigkeit beruhend betrachtet werden 

1 Verofferrtiichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann nicht als auf erfinderischer Tatigkeit beruhend betrachtet 
werden, werm die Verofferrtiichung mit einer Oder mehreren anderen 
Ve r6ff e ntii ch unge n dieser Kategorie in Verbindung gebracht wird und 
diese Verbindung fur einen Fachmann naheQegend ist 

' Verdffentlichung, die Mitglied derselben Patentfamilie ist 



Datum des Abschlusses der internalionaJen Recherche 

10. Februar 2000 


Absendedatum des internationalen Recherche nberichts 

28/02/2000 


Name und Postanschrift der tntemationalen Recherchenbehdrde 
EuTopaisches Patentamt, P.B. 5818 PalentJaan 2 
NL - 2280 HV Rijswijk 
Tel. (+31-70) 34O-2040, Tx. 31 651 epo rtf. 
Fax: (+31-70) 340-3016 


Bevoltmachtigter Bediensteter 

Ceder, 0 



Fomiblatt PCT7ISA/21 0 (Blatt 2) (Jufi 1992) 



Seite 1 von 2 



"INTERNATIONA 



ECHERCHENBERICHT 



i^^^Bn ationales Aktenzeichen 

pCT/DE 99/01867 



C(Fortsetzung) ALS WESENTLICH ANGESEHENE UNTERLAGEN 



Kategorie* Bezeichnung der Veroffentfichung, sowett erforderfich unter Angabe der in Betracht kommenden Teile 



Betr. Anspruch Nr. 



REICHWALD ET AL. : "Homo sapiens 
chromosome X, Mecp2 locus, complete 
sequence" 

EMBL SEQUENCE DATABASE, 

6. April 1998 (1998-04-06), XP002130191 

HEIDELBERG DE 

Ac AF030876 

das ganze Dokument 

WO 93 10228 A (SYNAPTIC PHARMACEUTICAL 
CORPORATION) 27. Mai 1993 (1993-05-27) 
Zusammenf assung; Anspruche 
Seite 4 -Seite 9 

M0 95 24503 A (RAPAP0RT ET AL.) 
14. September 1995 (1995-09-14) 
Zusammenf assung 



1-8 



1,7,9-26 
1,7,9-26 

21,22 



FormWatl PCT/1SA/21 0 (Fortsettung von Btatl 2) (Jufi 1992) 



Seite 2 von 2 



'INTERNATIONALE 

Angaben zu Veroffentlichung^l 



W 

jelJBre zu 



HERCHENBERICHT 

zur selben Patentfamflie gehoren 



|PCT> 



itionales Aktenzeichen 



PCT/OE 99/01867 



lm Recherchenbericht 


Datum der 




Mitglied(er) der 




Datum der 


anyetunries rateniCK^Kurneni 


v e rone n n i cn u ng 




Patentfcirrtilie 




Verdffentiichung 


WO 9310228 A 


27-05-1993 


AU 


679432 


B 


03- 


-07- 


1997 






AU 


3071392 


A 


15- 


-06- 


1993 






EP 


0614487 


A 


14- 


-09- 


1994 






US 


5756348 


A 


26- 


-05- 


1998 



W0 9524503 A 14-09-1995 AU 1893095 A 25-09-1995 

EP 0759092 A 26-02-1997 
US 5955273 A 21-09-1999 



FormWan PCT/JSA/210 (Anhang PatentfanffleM-luB 1992) 



PCT 



KAPITEL II 



BLATT FUR DIE GEBUHRENBERECHNUNG 



Anhang zum Antrag auf internationale vorlaufige Priifung 



Internationales 
Aktenzeichen 



PCT/DE99/01867 



Aktenzeichen des 

Anmelders oder Anwalts K 2690 - sch/msl 



Von der mit der internationalen vorlaufigen Priifung 
beauftraeten Behorde auszufullen 



Eingangsstempel der IPEA 



Anmelder 

Deutsches Krebsforschungszentrum Heidelberg 



Berechnung der vorgeschriebenen Gebiihren 

1 . Gebtihr fur die vorlaufige Priifung 

2. Bearbeitungsgebiihr (Anmelder atts einigen Siaaten 
hah en Anspruch auf eine Ermiifiigung der 
Bea rheitungsgebiih r um 75%. Hat der Anmelder (oder 
haben alle Anmelder) einen solchen Anspruch, so 
betrdgt der in Feld H einzutragende Betrag 25 % der 
Bearbeitungsgebiihr. ) 

3. Gesamtbetrag der vorgeschriebenen Gebiihren 
Addieren Sie die Betrage in den Feldern 

P und H und tragen Sie die Summe in 

das nebenstehende Feld ein 



Zahlungsart 



□ 

□ 
□ 



Abbuchunesauftrag fur das 
laufende Konto bei der IPEA 
(siehe unten) 

Scheck 5608 

Postanweisung 

Bankwechsel 




| | Barzahlung 

| | Gebuhrenmarken 

| | Kupon; 

| | Sonstige (einzeln angeben): 



Abbuchungsauftrag (diese Zahhtngsweise gibt es nicht bei alien Behorden) 



Die IPEA/ 




wird beauftragt. den vorstehend angegebenen Gesamtbetrag der Gebiihren von meinem laufenden 
Konto abzubuchen. 



I I (dieses Kdstchen darf nur angekreuzt werden, wenn die Vorschriften der fPEA iiher laufende Konten 

* ' dieses Verfahren ertauben) wird beauftragt, Fehlbetriige oder Uberzahlungen des vorstehend angegebenen 

Gesamtbetrags der Gebiihren meinem laufenden Konto zu belasten bzw. gutzuschreiben. 



Kontonummer Datum (Tag/Monat/Jahr) Unterschrift 

Formbiatt PCT/IPEA/401 (Anhang) (Juli 1998; Nachdruck Juli 1999) Siehe Anmerkungen zum Blatt fur die Cebithrenherechnung 



DerAntrag ist bei der zustandigen mil derihTernationalen vorldufigen Prufung beauflragten Behdrde oder^Wnn zwei oder mehr Belwrden zuslandig sind, hex der 
vom Anmelder gewahlten Behdrde einzureichen. DerAnmelder kann den Namen oder den Zweibuchstaben-Code der Behdrde auf der nachstehenden Zeile angeben, 
IPEA7 



PCT 



KAPITEL II 



ANTRAG AUF INTERNATIONALE VORLAUFIGE PRUFUNG 

nach Artikel 31 des Vertrags iiber die Internationale Zusammenarbeit auf dem Gebiet des Patentwesens: 
Der (die) Unterzeichnete(n) beantragt (beantragen), daB fiir die nachstehend bezeichnete internationale Anmeldung 
die internationale vorlaufige Prufung nach dem Vertrag uber die internationale Zusammenarbeit auf dem 
Gebiet des Patentwesens durchgefuhrt wird und benennt hiermit als ausgewahlte Staaten 
alle auswahlbaren Staaten (soweit nichts anderes angegeben). 

Von der mit der internationalen vorlaufigen Prufung beauftragten Behorde auszufiillen 



Bezeichnung der IPEA 



Eingangsdatum des ANTRAGS 



Feld Nr. I KENNZEICHNUNG DER INTERNATIONALEN ANMELDUNG 


Aktenzeichen des Anmelders oder Anwalts 

K 2690 - sch/msl 


Internationales Aktenzeichen 

PCT/DE99/01867 


Internationales Anmeldedatum (Tag/Moimt/Jahr) 
25. Juni 1999 (25.06.99) 


(Friihester) Prioritatstag (Tag/Monat/Jahr) 
26. Juni 1998 (26.06.98) 



Bezeichnung der Erfindung 

Modular aufgebaute RNA-Molekiile mit zwei Sequenzbereichstypen 



Feld Nr. II ANMELDER 



Name und Anschrift: (Familienname. Vorname; bei jttristischen Personen vollstandige amtliche 
Bezeichnung. Bei der Anschrift sind die Postleitzahl und der Name des Staats 
anzugeben. ) 


Telefonnr.: 


Deutsches Krebsforschungszentrum 
Stiftung des offentlichen Rechts 
Im Neuenheimer Feld 280 


Telefaxnr.: 


D-69120 Heidelberg 


Femschreibnr.: 



Staatsangehorigkeit (Staat): 
DE 



Sitz oder Wohnsitz (Staat): 
0E 



Name und Anschrift: (Familienname. Vorname: bei juristischen Personen vollstandige amtliche Bezeichnung. Bei der Anschrift sind die Postleitzahl und der Name des Staats anzugeben.) 

POUSTKA, Annemarie 
Werderstrasse 36 

D-69120 Heidelberg 



Staatsangehorigkeit (Staat): 


Sitz oder Wohnsitz (Staat): 


DE 


DE 


Name und Anschrift: (Familienname, Vorname; bei juristischen Personen vollstandige amtliche Bezeichnung. Bei der Anschrift sind die Postleitzahl und der Name des Staats anzugeben.) 


COY, Johannes 




In den schwarzen Garten 1 




D-63762 Gross-Ostheim 





Staatsangehorigkeit (Staat): 
DE 



Sitz oder Wohnsitz (Staat): 
DE 



| | Weitere Anmelder sind auf einem Fortsetzungsblatt angegeben. 



Formblatt PCT/IPEA/401 (Blatt 1) (Juli 1998; Nachdruck Juli 1999) 



Siehe Anmerkungen zu diesem Antragsformular 



2 

Blatt Nr. . 



Internationales Aktenzeichen 
PCT/DE99/01867 



Feld Nr. Ill AN WALT ODER GEMEINSAMER VERTRETER; ODER ZUSTELLANSCHRIFT 



Die folgende Person ist |X | An wait | | gemeinsamer Vertreter 

und | Y I ist vom (von den) Anmelder(n) bereits friiher bestellt worden und vertritt ihn (sie) auch fur die international vorlaufige 
]JU Priifung. 

| | wird hiermit bestellt; eine etwaige friihere Bestellung eines Anwalts/gemeinsamen Vertreters wird hiermit widerrufen. 

nwird hiermit zusatzlich zu dem bereits friiher bestellten Anwalt/gemeinsamen Vertreter, nur fur das Verfahren vor der 
mit der internationalen vorlaufigen Priifung beauftragten Behorde bestellt. 



Name und Anschrift: (Famiiienname. Vorname: bei juristischen Personen voHsUindige amiliche 
Bezeichnung. Bei der Anschrift sind die Postleitzaht und der Name des Staats 
anzugeben. ) 

SCHUBLER, Andrea 
Truderinger Str. 246 

81825 Munchen 



Telefonnr.: 

089/42724748 



Telefaxnr.: 

089/42724749 



Fernschreibnr.: 



□ Zustellanschrift: Dieses Kastchen ist anzukreuzen, wenn kein Anwalt oder gemeinsamer Vertreter bestellt ist und statt 
dessen im obigen Feld eine spezielle Zustellanschrift angegeben wird. 



Feld Nr. IV GRUNDLAGE DER INTERNATIONALEN VORLAUFIGEN PRUFUNG 



Erklarung betreffend Anderungen:* 

1. Der Anmelder wiinscht, daB die internationale vorlaufige Priifung auf der Grundlage 
|X I der internationalen Anmeldung in der urspriinglich eingereichten Fassung 
der Beschreibung | X| in der urspriinglich eingereichten Fassung 

| | unter Beriicksichtigung der Anderungen nach Artikel 34 

der Patentanspriiche | Xl in der urspriinglich eingereichten Fassung 

| | unter Beriicksichtigung der Anderungen nach Artikel 19 
(ggf. zusammen mit Begleitschreiben) 

1 1 unter Beriicksichtigung der Anderungen nach Artikel 34 

der Zeichnungen 1 X | i n der urspriinglich eingereichten Fassung 

| | unter Beriicksichtigung der Anderungen nach Artikel 34 

aufgenommen wird. 

2. | | Der Anmelder wiinscht, daB jegliche nach Artikel 19 eingereichte Anderung der Anspriiche als uberholt angesehen wird. 

3. | | Der Anmelder wiinscht. daB der Beginn der internationalen vorlaufigen Priifung bis zum Ablauf von 20 Monaten ab dem 

Prioritatsdatum aufgeschoben wird. sofern die mit der internationalen vorlaufigen Priifung beauftragte Behorde ntcht eine 
Kopie nach Artikel 19 vorgenommener Anderungen oder eine Erklarung des Anmelders erhalt. daB er keine solchen 
Anderungen vornehmen will (Regel 69.1 Absatz d). (Dieses Kastchen darf nur angekreuzt werden, wenn die Frist nach 
Artikel 19 noch ntcht abgelaufen ist.) 

* Wenn kein Kastchen angekreuzt wird, wird mit der internationalen vorlaufigen Priifung auf der Grundlage der internationalen 
Anmeldung in der urspriinglich eingereichten Fassung begonnen; wenn eine Kopie der Anderungen der Anspriiche nach Artikel 19 
und/oder Anderungen der internationalen Anmeldung nach Artikel 34 bei der mit der internationalen vorlaufigen Priifung 
beauftragten Behorde eingeht. bevor diese mit der Erstellung eines schriftlichen Bescheids oder des internationalen vorlaufigen 
Priifungsberichts begonnen hat. wird jedoch die geanderte Fassung verwendet. 



Sprache fur die Zwecke der internationalen vorlaufigen Priifung: 



|X 1 dies ist die Sprache, in der die internationale Anmeldung eingereicht wurde. 

| | dies ist die Sprache der Ubersetzung, die fur die Zwecke der internationalen Recherche eingereicht wurde. 

| | dies ist die Sprache der Veroffentlichung der internationalen Anmeldung. 

| | dies ist die Sprache der Ubersetzung. die fiir die Zwecke der internationalen'vorlaufigen Priifung eingereicht wurde/wird. 



Feld Nr. V BENENNUNG VON STAATEN ALS AUSGEWAHLTE STAATEN 



Der Anmelder benennt hiermit als ausgewahlte Staaten alle auswahlbaren Staaten (das heiflt, alle Staaten. die bestimmt wurden und 
durch Kapitel II gebunden sind) 

mit Ausnahme der folgenden Staaten, die der Anmelder nicht benennen mochte: 



Formblan PCT/IPEA/401 (Blatt 2) (Juli 1998; Nachdruck Juli 1999) 



Siehe Anmerkungen zu diesem Antragsformular 



Blatt Nr. 



Internationales Aktenzeichen 

PCT/DE99/01867 



Feld Nr. VI KONTROLLISTE 



Dem Antrag liegen folgende Unterlagen furdieZwecke der internationalen vorlaufigen 
Priifung in der in Feld Nr. IV angegebenen Sprache bei; 



1. Ubersetzung der internationalen Anmeldung 

2. Anderungen nach Artikel 34 

3. Kopie (oder, falls erforderlich, Ubersetzung) 
der Anderungen nach Artikel 1 9 

4. Kopie (oder, falls erforderlich, Ubersetzung) 
einer Erklarung nach Artikel 1 9 

5. Begleitschreiben 

6. Sonstige (einzeln auffuhren) 



Blatter 
Blatter 

Blatter, 

Blatter 
Blatter 
Blatter 



Von der mit der internationalen vorlaufigen 
Priifung beauftragten Behorde auszufullen 



erhalten 

□ 
□ 

□ 

□ 
□ 
□ 



nicht erhalten 

□ 
□ 

□ 

□ 
□ 
□ 



Dem Antrag liegen auBerdem die nachstehend angekreuzten Unterlagen bei: 

1. [Y] Blatt fur die Gebuhrenberechnung 4 * EU Begrilndung fur das Fchlen einer Unterschrift 



2. | | unterzeichnete gesonderte Vollmacht 

3. I I Kopie der allgemeinen Vollmacht; 
Aktenzeichen (falls vorhanden): 



5. I I Nucleotid- und/oder Aminosauresequenz- 
protokoll in computerlesbarer Form 

6. | X | sonstige (einzeln auffiihren): Scheck 5608 



Feld Nr. VII UNTERSCHRIFT DES ANMELDERS, ANWALTS ODER GEMEINSAMEN VERTRETERS 



Der Name jeder unterzeichnenden Person ist neben der Unterschrift zu wiederholen, und es ist anzugeben, sofern sich dies nicht aus 
dem Antrag ergibt, in welcher Eigenschaft die Person unterzeichnet. 

Munchen, den 24. Januar 2000 



Dr. Andrea SchbBler 



Von der mit der internationalen vorlaufigen Priifung beauftragten Behorde auzufiillen 



1 . Datum des tatsachlichen Eingangs des ANTRAGS: 



2. Geandertes Eingangsdatum des Antrags aufgrund von 
BERICHTIGUNGEN nach Reael 60.1 Absatz b: 



3 I — I Eingangsdatum des Antrags NACH Ablauf von 19 Monaten ab 
I — I Prioritatsdatum; Punkt 4 und Punkt 5, unten. finden keine Anwendung. 



□ 



Der Anmelder wurde 
entsprechend unterrichtet 



4. [^j Eingangsdatum des Antrags INNERHALB 19 Monate ab Prioritatsdatum wegen Fristverlangerung nach Regel 80.5. 



5, | I Das Eingangsdatum des Antrags liegt nach Ablauf von 19 Montaten ab Prioritatsdatum, der verspatete Eingang ist aber nach 
' — ' Regel 82 ENTSCHULDIGT. ^ 



Vom Internationalen Burb auszufullen 



Antrag vom IPEA erhalten am: 



Formblatt PCT/IPE A/401 (letztes Blatt) (Juli 1998: Nachdruck Juli 1999) 



Siehe Anmerkungen zu diesem Antragsformular 



' vertrag tub a)ie internationale zusai\anarbett auf dem 

gebietdespatentwesettc 



Absender: MIT DER INTERNATIONALEN VORLAUFIGEN 
PRUFUNG BEAUFTRAGTE BEHORDE 



An: 

SCHUSSLER Andrea 
Truderinger Str. 246 
D-81825 Munchen 


Huber & SchuBler 
Patentanwalte 

2 9. SEP. 2000 


DPT 

mitteilung uber die obersendung 
des internationalen vorlaufigen 
prOfungsberichts 

(Regel71.1 PCT) 


Absendedatum 

(Tag/Monat/Jahr) 27.09.2000 


, hnst; , 


K 2690 - sch/msl 


W1CHTTGE MnTEILUNG 


Internationales Aktenzeichen Internationales Anmeldedatum (Tag/Monat/Jahr) Priorttatsdatum (Tag/Monat/Jahr) 
PCT/DE99/01867 25/06/1999 26/06/1998 


Anmelder 

DEUTSCHES KREBSFORSCHUNGSZENTRUM... eta!. 



1 . Dem Anmelder wird mitgeteilt, daB ihm die mit der intemationalen voriauf igen Pruf ung beauftragte Behorde 
hiermit den zu der intemationalen Anmeldung erstellten intemationalen vorlaufigen Prufungsbericht, 
gegebenenfalls mit den dazugehdrigen Anlagen, ubermittelt. 



2. Eine Kopie des Berichts wird - gegebenenfalls mit den dazugehdrigen Anlagen - dem Intemationalen Buro zur 
Weiterleitung an alle ausgewahlten Amter ubermittelt. 



3. Auf Wunsch eines ausgewahlten Amts wird das Internationale Buro eine Ubersetzung des Berichts 0©cJoch 
nicht der Anlagen) ins Englische anfertigen und diesem Amt ubermitteln. 



4. ERINNERUNG 

Zum Eintritt in die nationale Phase hat der Anmelder vor jedem ausgewahlten Amt innerhalb von 30 Monaten 
ab dem Prioritatsdatum (oder in manchen Amtem noch spater) bestimmte Handlungen (Einreichung von 
Obersetzungen und Entrichtung nationaler Gebuhren) vorzunehmen (Artikel 39 (1)) (siehe auch die durch das 
Internationale Buro im Formblatt PCT/IB/301 ubermittelte Information). 



1st einem ausgewahlten Amt eine Ubersetzung der intemationalen Anmeldung zu ubermitteln, so mu(3 diese 
Obersetzung auch Obersetzungen aller Anlagen zum intemationalen vorlaufigen Prufungsbericht enthalten. Es 
ist Aufgabe des Anmelders, solche Obersetzungen anzuf ertigen und den betroffenen ausgewahlten Amtem 
direkt zuzuleiten. 



Weitere Einzelheiten zu den maBgebenden Fristen und Erfordemissen der ausgewahlten Amter sind Band 
des PCT-Leitfadens fur Anmelder zu entnehmen. 



Name und Postanschrift der mit der intemationalen PrGfung 
beauftragten Behorde 

Europaisches Patentamt 

D-80298 MQnchen 
Tel +49 89 2399 - 0 Tx: 523656 epmu d 

Fax:+49 89 2399-4465 



Bevollmachtigter Bediensteter 
Vullo, C 

Tel. +49 89 2399-8061 




Formblatt PCT/IPEA/416 (Juli 1992) 



VERTRAG UBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM 

GEBIET DES PATENTWESENS 

PCT 



INTERNATIONALER VORLAUFIGER PRUFUNGSBERICHT 

(Artikel 36 und Regel 70 PCT) 



Aktenzeichen des Anmelders oder Anwalts 
K 2690 - sch/msl 


siehe Mitteilung uber die Ubersendung des internationalen 
WEITERES VORGEHEN voriaufigen Prufungsbericht (Formblatt PCT/1PEA/416) 


Internationales Aktenzeichen 
PCT/DE99/01867 


Internationales flj\me\detiatum(Tag/Monat/Jahr) 
25/06/1999 


Prioritatsdatum (Tag/Monat/Tag) 
26/06/1998 


Internationale Patentklassification (IPK) oder r 
C12N15/11 


rationale Klassifikation und IPK 


Anmelder 

DEUTSCHES KREBSFORSCHUNGSZENTRUM... etal. 





1 . Dieser internationale vorlaufige Prufungsbericht wurde von der mit der Internationale voriaufigen Prufung beauftragte 
Behorde erstellt und wird dem Anmelder gemaB Artikel 36 Qbermittelt. 



2. Dieser BER1CHT umfaBt insgesamt 6 Blatter einschlieBlich dieses Deckblatts. 

□ AuGerdem liegen dem Bericht ANLAGEN bei; dabei handelt es sich urn Blatter mit Beschreibungen, AnsprQchen 
und/oder Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser 
Behorde vorgenommenen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Verwattungsrichtlinien zum PCT). 

Diese Anlagen umfassen insgesamt Blatter. 



3. Dieser Bericht enthalt Angaben zu folgenden Punkten: 



1 




II 


□ 


III 




IV 


□ 


V 


El 


VI 


□ 


VII 


□ 


VIII 





Grundlage des Berichts 
PrioritSt 

Keine Erstellung eines Gutachtens Qber Neuheit, erfinderische Tatigkeit und gewerbliche Anwendbarkeit 
Mangelnde Einheitlichkert der Erf indung 

Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderische Tatigkeit und der 
gewerbliche Anwendbarkeit; Unterlagen und ErWarungen zur StQtzung dieser Feststellung 

Bestimmte angefuhrte Unterlagen 

Bestimmte Mangel der internationalen Anmeldung 

Bestimmte Bemerkungen zur internationalen Anmeldung 



Datum der Einreichung des Antrags 



24/01/2000 



Datum der Fertigstellung dieses Berichts 



27.09.2000 



Name und Postanschrift der mit der internationalen voriaufigen 
Prufung beauftragten Behorde: 
Europaisches Patentamt 

D-80298 MQnchen 
Tel. 449 89 2399 - 0 Tx: 523656 epmu d 

Fax +49 89 2399 - 4465 



Bevollmachtigter Bediensteter 
Kalsner, I 

Tel. Nr. +49 89 2399 8708 




Formblatt PCT/l PEA/409 (DeckWatt) (Januar 1994) 



sNTERNATIONALER VORLAUFIGER 
PRUFUNGSBERICHT 



Internationales Aktenzeichen PCT/DE99/01 867 



I. Grundlage des Berichts 

1 . Dieser Bericht wurde ersteltt auf der Grundlage (Ersatzblatter, die dem Anmeldeamt auf erne Aufforderung nach 
Artikel 14 hin vorgelegt warden, gotten im Rahmen dieses Berichts ais "ursprunglich eingereicht" und sind ihm 
nicht beigefugt, weil sie keine Anderungen enthalten.y. 

Beschreibung, Seiten: 

1-17 ursprungliche Fassung 

Patentanspruche, Nr.: 

1-26 ursprungliche Fassung 

Zeichnungen, Blatter: 

1/21-21/21 ursprungliche Fassung 

2. Aufgrund der Anderungen sind folgende Unterlagen fortgefallen: 

□ Beschreibung, Seiten: 

□ Anspruche, Nr.: 

□ Zeichnungen, Blatt: 

3. □ Dieser Bericht ist ohne Berucksichtigung (von einigen) der Anderungen erstellt worden, da diese aus den 

angegebenen Grunden nach Auffassung der Behorde uber den Offenbarungsgehalt in der ursprunglich 
eingereichten Fassung hinausgehen (Regel 70.2(c)): 

4. Etwaige zusatzliche Bemerkungen: 

III. Keine Erstellung eines Gutachtens uber Neuheit, erfinderische Tatigkeit und gewerbliche Anwendbarkett 

Folgende Teile der Anmeldung wurden nicht daraufhin gepruft, ob die beanspruchte Erfindung als 

neu, auf erfinderischer Tatigkeit beruhend (nicht offensichtlich) und gewerblich anwendbar anzusehen ist: 

□ die gesamte intemationale Anmeldung. 
£3 Anspruche Nr. 20-22. 



Begrundung: 



Formbiatt PCT/IPEA/409 (Felder I- VIII, Blatt 1) (Januar 1994) 



INTERNATIONALER VORLAUFIGER 
PRUFUNGSBERICHT 



Internationales Aktenzeichen PCT/DE99/01 867 



□ Die gesamte intemationale Anmeldung, bzw. die obengenannten Anspruche Nr. beziehen sich auf den 
nachstehenden Gegenstand, fur den keine intemationale vorlaufige Pruf ung durchgefGhrt werden braucht 
(geriaue Angaben): 



□ Die Beschreibung, die Anspruche oder die Zeichnungen (machen Sie h'terzu nachstehend genaue Angaben) 
oder die obengenannten Anspruche Nr. sind so unklar, daB kein sinnvolles Gutachten erstellt werden 
konnte (genaue Angaben): 



H Die Anspruche bzw. die obengenannten Anspruche Nr. 20-22 sind so unzureichend durch die Beschreibung 
gestutzt, daB kein sinnvolles Gutachten erstellt werden konnte. 

□ Fur die obengenannten Anspruche Nr. wurde kein international r Recherchenbericht erstellt. 



V. Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erf inderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 

1. Feststellung 

Neuheit (N) Ja: Anspruche 2,3,5,8-19,23-26 

Nein: Anspruche 1 , 4, 6, 7 

Erfinderische Tatigkeit (ET) Ja: Anspruche 

Nein: Anspruche 2,3,5,8-19,23-26 

Gewerbliche Anwendbarkeit (G A) Ja: Anspruche 1-19,23-26 

Nein: Anspruche 



2. Unterlagen und Erklarungen 
siehe Beiblatt 



VIM. Bestimmte Bemerkungen zur internationalen Anmeldung 

Zur Klarheit der Patentanspruche, der Beschreibung und der Zeichnungen oder zu der Frage, ob die Anspruche 
in vollem Umfang durch die Beschreibung gestutzt werden, 1st folgendes zu bemerken: 

siehe Beiblatt 
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INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/DE99/01867 
PROFUNGSBERICHT - BEIBLATT 



Zu Abschnitt III: Keine Erstellunq eines Gutachtens uber Neuheit erfinderische 
Tatiqkeit und qewerbliche Anwendbarkeit 

Anspruche 20-22 entsprechen nicht den Erfordernissen von Art. 5 PCT: 

Aus der Beschreibung geht in keiner Weise hervor, daB die beanspruchten RNA- 
Moiekule auch tatsachlich die Funktion erfullen, die ihnen zugeschrieben wird. Die 
Beschreibung enthalt auch keinerlei Beispiele, die die postulierten Wirkungen der 
beanspruchten RNA in irgendeiner Weise bestatigen wurden. Anspruche 20-22, 
die sich auf die Verwendung der RNA-Molekule zur Herstellung von Arzneimitteln 
zur Behandlung von Tumorerkrankungen oder Erkrankungen des 
Zentralnervensystems beziehen, sind daher in der Beschreibung nicht gestiitzt. 

Zu Abschnitt V: Beqrundete Feststellunq hinsichtlich Neuheit. erfinderischer 
Tatiqkeit und qewerblicher Anwendbarkeit 

1 ) Dokumente 

D1...Seager et al. (1979) Introductory Chemistry; S. 499; Abb. 25.14 

D2... Reich wald et al. (1998) EMBL sequence database Acc. No. AF031078 

D3...Reichwald et al. (1998) EMBL sequence database Acc. No. AF030876 

2) Neuheit und erfinderische Tatigkeit 

2.1) Anspruch 1 bezieht sich auf ein RNA-Molekul, das an einen Liganden binden 
kann und folgende Sequenzbereiche umfaBt: (a) einen die dreidimensionale 
Struktur des RNA Molekuls aufrechterhaltenden Sequenzbereich und (b) einen 
Sequenzbereich fur die spezifische Bindung des Liganden. 

RNA, die diese Merkmale erfullt, ist z. B. Transfer-RNA (siehe D1). Anspruch 1 
und abhangige Anspruche 4 und 6 konnen daher nicht als neu anerkannt 
werden. 

2.2 Anspruch 7, der sich auf eine DNA-Sequenz bezieht, die die RNA-Molekul nach 
einem der vorangegangenen Anspruche kodiert, kann im Hinblick auf die in D2 
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INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/DE99/01 867 
PRUFUNGSBERICHT - BEIBLATT 



oder D3 veroffentlichte Sequenz nicht als neu anerkannt werden. 

2.2) Anspruche 2, 3, 5, 8-19 und 23-26 entsprechen formell den Erfordernissen von 
Art. 33(2) PCT: 

Wie aus D2 und D3 ersichtlich ist, ist die DNA-Sequenz der Abb. 1 in der EMBL- 
Datenbank veroffentlicht. Da diesem Dokument jedoch nicht zu entnehmen ist, 
daf3 die Sequenz naher analysiert oder charakterisiert wurde, konnen diese 
Dokumente fur Anspruche 2, 3, 5 und 8-26 formell nicht als neuheitsschadlich 
angesehen werden. 

2.3) Fur Anspruche 2, 3, 5, 8-19 und 23-26 kann jedoch aus den folgenden Grunden 
keine erfinderische Tatigkeit anerkannt werden: 

Die Computer-unterstutze Analyse von bereits veroffentlichten DNA-Sequenzen 
und deren daraus abgeleitete potentielle Eigenschaften und 
Verwendungsmoglichkeiten, ohne diese durch wenigstens ein konkretes Beispiel 
zu bestatigen, kann nicht als erfinderisch angesehen werden. Das trifft 
insbesondere auf die vorliegenden Anspruche zu, die sich auf eine undefinierte 
Anzahl von RNA-Molekulen beziehen, deren einziges Merkmal ist, daB sie sowohl 
einen Bereich enthalten, der eine dreidimensionale Struktur bilden kann als auch 
einen Bereich, der einen Liganden binden kann. 

Zu Abschnitt VIII: Bestimmte Bemerkunqen zur internationalen Anmeldunq 

Anspruche 1-7 entsprechen nicht den Erfordernissen von Art. 6 PCT. 

Anspruch 1 ist nicht durch technische Merkmale charakterisiert. Das 
beanspruchte RNA-Molekul ist daher unzureichend definiert, sodaB es fur den 
Fachmann unzumutbar erscheint, zu bestimmen ob ein gegebenes RNA-Molekul 
unter den Schutzumfang des Anspruchs fallt oder nicht. 

Anspruche 2 und 3 versuchen das RNA-Molekul von Anspruch 1 naher zu 
definieren. Der dabei gewahlte Wortlaut fuhrt zu weiteren Unklarheiten. Es ist z. B. 
nicht klar welcher Bereich der Abb. 3 tatsachlich in Anspruch 2 bzw. 3 definiert ist. 
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INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/DE99/01 867 
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"Der Balken" am Rand der dargestellten Sequenz bezeichnet z. B. eine Sequenz, 
die die Nukleotide von 820-1020, 820-1021, 820-1023, etc., Oder 821-1020, 821- 
1021, etc. umfassen kann. Weiters beziehen sich Anspruche 2 und 3 auf 
"verwandte Sequenzen". Laut Beschreibung (S. 4) konnen dies beliebige nicht 
naher definierte Sequenzen sein. Der Schutzumfang der Anspruche ist somit nicht 
klar. 

Daruber hinaus entsprechen Anspruche 2 und 3 nicht den Erfordernissen von 
Regel 6.2(a) PCT, die besagt, daB Anspruche sich nicht auf Abbildungen 
beziehen sollen. 




Formblatt PCT/Beiblatt/409 (Blatt 3) (EPA- April 1997) 



PCT 



ANTRAG 



Der Unterzeichnete beantragt, da£ die vorliegende 
internationale Anmeldung nach dem Vertrag uber die 
internationale Zusarnrnenarbeit auf dem Gebiet des 
Patentwesens behandelt wird. 



Vom Anmeldeamt auszufullen 



Internationales Aktenzeichen 



Internationales Anmeldedatum 



Name des Anmeldeamts und "PCT International Application" 



Aktenzeichen des Anmelders oder Anwalts (falls gewunscht) 



(max. 12 Zeichen) 



K 2690 - sch/msl 



Feld Nr. I BEZEICHNUNG DER ERFINDUNG 
Modular aufgebaute RNA-Molekule mit zwei 


. Sequenzbereichstypen 


Feld Nr. II ANMELDER 


Name und Anschrift: (Famiiienname, Vorname; bei Juristischen Personen vollstandige amtliche Bezeichnung. 
Bei der Anschrift sind die Postleitzahl und der Name des Stoats anzugeben. Der in diesem Feld in der 
Anschrift angegebene Stoat ist der Stoat des Sitzes oder Wohnsitzes des Anmelders, sofern nachstehend kein 
Stoat des Sitzes oder Wohnsitzes angegeben ist.) 

Deutsches Krebsforschungszentrum 
Stiftung des off entlichen Rechts 
Im Neuenheimer Feld 280 

D-69120 Heidelberg 


1 1 Diese Person ist 
' — ' gleichzeitig Erflnder 


Telefonnr.: 


Telefaxnr.: 


Fernschreibnr.: 


Staatsangehorigkeit (Staat): 

DE 


Sitz oder Wohnsitz (Staat): 

DE 


Diese Person ist Anmelder i | alle Bestim- 1 | alleBesummungsstaatenmitAusnahme 1 1 nur die Vcreinigten I ) die im Zusatzfeld 

filrfolgendeStaaten: | | mungsstaaten g(_J der Vereinigten Staaten von Amerika | | Staaten von Amerika I I angegebenen Staaten 


Fe!d Nr. Ill WEITERE ANMELDER UND/ODER (WEITERE) ERFINDER 


Name und Anschrift: /Famiiienname, Vorname; beijuristischen Personen vollstandige amtliche Bezeichnung. 
Bei der Anschrift sind die Postleitzahl und der Name des Stoats anzugeben. Der in diesem Feld in der 
Anschrift angegebene Staat ist der Staat des Sitzes oder Wohnsitzes des Anmelders, sofern nachstehend kein 
Staat des Sitzes oder Wohnsitzes angegeben ist.) 

POUSTKA, Annemarie 
WerderstraBe 36 

D-69120 Heidelberg 


Diese Person ist: 
| | nur Anmelder 

| X | Anmelder und Erflnder 

1 | nur Erflnder (Wird dieses Kastchen 
I— J angekrevzt, so sind die nachstehenden 
Angaben nicht notig.) 


Staatsangeh6rigkeit (Staat): 

DE 


Sitz oder Wohnsitz (Staat): 

DE 


Diese Person ist Anmelder r 1 alk Bestim- ( 1 alle Bestimmungsstaaten mit Ausnahme [— ~| nur die Vereinigten 1 1 die im Zusatzfeld 
filrfolgendeStaaten: L_J mungsstaaten | | der Vcreinigten Staaten von Amerika 1 a I Staaten von Amerika 1 1 angegebenen Staaten 


| X | Weitere Anmelder und/oder (weitere) Erflnder sind auf einem Fortsetzungsblart angegeben. 


Feld Nr. IV ANWALT ODER GEMEINSAMER VERTRETER; ODER ZUSTELLANSCHRIFT 


Die folgende Person wird hiermit bestellt/ist bestellt worden, urn fur den (die) Anmelder |7— l Anwa i t 1 — 1 gemeinsamer 
vor den zustandigen intemationalen Behfirden in folgender Eigenschaft zu handeln als: L_l Anwail | | Vertreter 


Name und Anschrift: (Famiiienname. Vorname; bei juristischen Personen vollstandige amtliche 
. Bezeichmmg. Bei der Anschrift sind die Postleitzahl und der Name des Stoats 
anzugeben.) 

Dr. Andrea SchuBler 
Truderinger Str. 246 

D-81825 Munchen - 


Tddbnnr.: 08 g /42 724748 


Telefaxnr.: 

089/42724749 . 


Fernschreibnr.: 


1 | Zustellanschrift: Dieses Kastchen ist anzukreuzen, wenn kein Anwait oder gemeinsamer Vertreter bestellt ist und start dessen im 
1 1 obigen Feld eine spezielle Zustellanschrift angegeben ist. 



FormblattPCT/RO/101 (Blart l)(Juli 1998) 



Siehe Anmerkungen zu diesem Antragsformular 



Blatt Nr. : 



Fortsetzung von Feld Nr. Ill WEITERE ANMELDER UND/ODER (WEITERE) ERFINDER 


Wird kernes der folgenden Felder benutzt, so sollte dieses Blatt dem Antrag nicht beigefugt werderu 


Name raid Anschrift: (Familienname. Vorname: bei juristischen Personen vollstandige amtliche Bezeichnmg. 
Bei der Anschrift sind die Postleitzahl und der Name des Staats anzvgeben. Der in diesem Feld in der 
Anschrift angegebene Staat ist der Staar des Sitzes oder Wohnsitzes des Anmelders, sofern nachstehend kein 
Slant des Sitzes oder Wohnsitzes angegeben ist.) 

COY, Johannes 

In den schwarzen Garten 1 

D63762 GroB-Ostheim 


Diese Person ist: 
| | nur Anmelder 

I ^ | Anmelder und Erfinder 

| | nur Erfinder (Wird dieses Kastchen 

* 1 angekreuzt, so sind die nachstehenden 

Angaben nicht notig.) 


Staatsangehorigkeit (Staat): 

DE 


Sitz oder Wohnsitz (Staat): 

DE 


Diese Persjm ist Anmelder i ] alle Bestim- I ] allc Besummungssuatenmit Ausnahme f— I nurdie Vereinigten 1 1 die im Zusatzfcld 

nlrtolgcndebtaaten: | 1 mungsstaaten | | der Vereinigten Staaten von Amerika \A_J Staaten von Amerika | I angegebenen Staaten 


Name und Anschrift: (Familienname, Vorname; bei juristischen Personen vollstandige amtliche Bezeichnvng. 
Bei der Anschrift sind die Postleitzahl und der Name des Staats anzvgeben. Der in diesem Feld in aer 
Anschrift angegebene Staat ist der Staat des Sitzes oder Wohnsitzes des Anmelders. sofern nachstehend kein 
Staat des Sitzes oder Wohnsitzes angegeben ist.) 


Diese Person ist: 
| | nur Anmelder 

I | Anmelder und Erfinder 

1 I nur Erfinder (Wird dieses Kastchen 

1 1 angekreuzt, so sind die nachstehenden 

Angaben nicht notig.) 


Staatsangeherigkeit (Staat): 


Sitz oder Wohnsitz (Staat): 


' Diese Person ist Anmelder i | alle Bestim- | | alle Bestimmungsstaaien mil Ausnahme I 1 nur die Vereinigten 1 1 die im Zusatzfeid 

fur lolgende Staaten: | I mungsstaaten I | der Vereinigten Staaten von Amerika | | Staaten von Amerika | | angegebenen Staaten 


Name und Anschrift; (Familienname. Vorname: bei juristischen Personen vollstandige amtliche Bezeichnung. 
Bei der Anschrift sind die Postleitzahl und der Name des Staats anzvgeben. Der in diesem Feld in der 
Anschrift angegebene Staat ist der Staat des Sitzes oder. Wohnsitzes des Anmelders, sofern nachstehend kein 
Staat des Sitzes oder Wohnsitzes angegeben ist.) 


Diese Person ist: 
| | nur Anmelder 

I | Anmelder und Erfinder 

1 1 nur Erfinder (Wird dieses Kastchen 

1 1 angekreuzt, so sind die nachstehenden 

Angaben nicht notig.) 


Staatsangehorigkeit (Staat): 


Sitz oder Wohnsitz (Staat): 


Diese Person ist Anmelder i | alle Bestim- | 1 alle Bestimmungsstaaien mit Ausnahme 1 1 nur die Vereinigten 1 1 die im Zusatzfeid 

fur folgende Staaten: L_J mungsstaaten | | der Vereinigten Staaten von Amerika | | Staaten von Amerika 1 1 angegebenen Staaten 


Name und Anschrift: (Familienname, Vorname: bei jurist 'tschen Personen vollstandige amtliche Bezeichnung. 
Bei der Anschrift sind die Postleitzahl und der Name des Staats anzvgeben Der in diesem Feld in aer 
Anschrift angegebene Staat ist der Staat des Sitzes oder Wohnsitzes des Anmelders sofern nachstehend kein 
Staat des Sitzes oder Wohnsitzes angegeben ist.) 


Diese Person ist: 
| | nur Anmelder 

| | Anmelder und Erfinder 

| 1 nur Erfinder (Wird dieses Kastchen 

1 1 angekreuzt so sind die nachstehenden 

Angaben nicht notig.) 


Staatsangehdrigkeit (Staat): 


Sitz oder Wohnsitz (Staat): 


Diese Person ist Anmelder | I alle Bestim- 1 1 aJleBestimmungsstaaten mil Ausnahme 1 1 nurdie Vereinigten | 1 die im Zusatzfeid 

fur folgende Staaten: | I mungsstaaten | | der Vereinigten Staaten von Amerika | | Staaten von Amerika I I angegebenen Staaten 


1 1 Weitcrc Anmelder und/oder (weitere) Erfinder sind auf einem zusatzlichen Fortsetzungs blatt angegeben. 



Formblatt PCT/RO/101 (Fortsetzungsblatt) (Juli 1998) Siehe Anmerkungen rw diesem Antragsformular 



Blatt Nr. 



Feld Nr. V BESTIMMUNG VON STAATEN 



Die folgendcn Bestimmungen nach Rcgcl 4.9 Absatz a wcrden hicrmit vorgenommen 
mufl angekreuzt warden) : 



(bate die entsprechenden Kastchen ankreuzen; wenigstens ein Kastche* 



Region ales Patent 

AP ARIPO-Patent: GH Ghana, GM Gambia, KE Kenia, LS Lesotho, MW Malawi, SD Sudan, SZ Swasiland, 
UG Uganda, ZW Simbabwe und jedcr weitcre Staat, der Vertragsstaat des Harare-Protokolls und des PCT ist 

Eurasisches Patent: AM Armenicn, AZ Aserbaidschan, BY Belarus, KG Kirgisistan, KZ Kasachstan, MD Republik 
Moldau, RU Russische Foderation, TJ Tadschikistan, TM Turkmenistan und jeder weitere Staat, der Vertragsstaat des 
Eurasischen Patentubereinkommens und des PCT ist 

Europaisches Patent: AT Osterreich, BE Belgien, CH und LI Schweiz und Liechtenstein, CY Zypern, 
^ DE Deutschland, DK Danemark, ES Spanien, FI Finnland, FR Frankreich, GB Vereinigtes K6nigreich,GR Griechenland' 
IE Irland, IT I tali en, LU Luxemburg, MC Monaco, NL Niederlande, PT Portugal, SE Schweden und jeder weitere Staat, 
der Vertragsstaat des Europaischen Patentubereinkommens und des PCT ist 
[/] OA O API-Pa tent: BF Burkina Faso, BJ Benin, CFZentralafrikanische Republik,CG Kongo, CI Cote d' I voire, CM Kamerun, 
GA Gabun, GN Guinea, ML Mali, MR Mauretanien, NE Niger, SN Senegal, TD Tschad, TG Togo und jeder weitere 
Staat, der Vertragsstaat der OAPI und des PCT ist ffalb eine andere Schutzrechtsart oder em sonstiges Verfahren gewimscht wird bate 
auf der gepunkteten Link angeben) 

Nationales Patent (falls eine andere Schutzrechtsart oder ein sonstiges Verfahren gewunscht wira\ bitte auf der gepunkteten Linie angeben): 



EA 



_EP 



PJ 
ta 

ja 

m 
® 
m 
m 
m 
s 

ta 
□ 

® 

BJ 

® 

o 

0 

13 
SQ 

13 
El 

eg 



AL Albanien H LS Lesotho . . . 

AM Armenien El LT Litauen 

AT Osterreich EJ LU Luxemburg 

AU Australien 0 LV Lettland 

AZ Aserbaidschan 0 

BA Bosnien-Herzegowina G(l 

BB Barbados Q3 

BG Bulgarien 

BR Brasilien 0 

BY Belarus H 

CA Kanada El 

CH und LI Schweiz und Liechtenstein (3 

CN China , . . : 0 

Kuba \jQ 

Tschechische Republik El 

Deutschland E$ 

Danemark Qf 

Estland , 0 

Spanien 

Finnland . 

Vereinigtes KOnigreich 6] 

Georgien EI 

Ghana , 83 

GM Gambia 

GW Guinea-Bissau 

Kroatien Op 

Ungarn 0^ 

Indonesien gj 

Israel : 

Island (§} 

Japan . . . 

Kenia UZ Usbekistan 

Kirgisistan 0 VN Vietnam . . . 

Demokratischc Volksrepublik Korea [$ YU Jugoslawien 

0 ZW Simbabwe . 



CU 

cz 

DE 

DK 

EE 

ES 

FI 

GB 

GE 

GH 



HR 

HU 

ID 

IL 

IS 

JP 

KE 

KG 

KP 



NZ 

PL 

PT 

RO 

RU 

SD 

SE 

SG 

SI 

SK 

SL 

TJ 



TT 
UA 
UG 
US 



MD Republik Moldau 

MG Madagaskar 

MK Die ehemalige jugoslawische Republik 

Mazedonien 

MN Mongolei 

MW Malawi 

MX Mexiko 

NO Norwegen 

Neuseeland 

Polen 

Portugal 

Rumanien 

Russische F5deration 

Sudan 
Schweden 
Singapur 

Slowenien 

Slowakei 

Sierra Leone 

Tadschikistan 

TM Turkmenistan 

TR TOrkei 

Trinidad und Tobago 

Ukraine : 

Uganda 

Vereinigte Staaten von Amerika 



KR 
KZ 
LC 
LK 
LR 



Republik Korea Kastchen fur die Bestimmung von Staaten (fur die Zwecke eines 

Kasachstan nationalen Patents), die dem PCT nach der VerSffentlichung 

dieses Formblatts bcigetreten sind: 



Saint Lucia 
Sri Lanka 
Liberia 



□ 
□ 



Erklamng bzgl. vorsorglicher Bestimmungen: ZusStzIich zu den oben genannten Bestimmungen nimmt der Anmelder nach 
Regel 4.9 Absatz b auch alle anderen nach dem PCT zulassigen Bestimmungen vor mit Ausnahme der im Zusatzfeld genannten 
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Anmelder: Deutsches Krebsforschungszentrum 
Unser Zeichen: K 2690 - hu / msl 



Modular aufgebaute RNA-Molekule mit zwei Sequenzbereichstypen 

Die vorliegende Erfindung betrifft RNA-Molekule, die durch zwei Sequenzbereichs- 
typen gekennzeichnet sind, einen ersten Sequenzbereichstyp, der zur Aufrech- 
terhaltung der dreidimensionalen Struktur des RNA-Molekuls beitragt, und einen 
zweiten Sequenzbereichstyp, der fur die spezifische Bindung eines Liganden verant- 
wortlich ist Vorzugsweise sind diese RNA-Molekule zur direkten Kontrolle der Gen- 
expression von Nutzen. Die vorliegende Erfindung stellt ferner die fur die erfin- 
dungsgemaBen RNA-Molekule abgeleitete DNA-Sequenz und diese enthaltende 
Vektoren bereit. Ferner betrifft die vorliegende Erfindung Arzneimittel und diagnosti- 
sche Zusammensetzungen, die die vorstehenden RNA-Molekule bzw. Vektoren 
enthalten, einen diese RNA-Molekule spezifisch erkennenden Antikorper bzw. spezi- 
fisch an diese RNA-Molekule bindende Antisense-RNA oder diese RNA-Molekule 
spaltende Ribozyme. AuBerdem betrifft die Erfindung nicht-menschliche transgene 
Sauger und daraus erhaltene Zellen. 

Die Regulation der Genexpression bei Eukaryonten erfolgt in der Regel uber Proteine, 
die ublicherweise an bestimmte regulatorische Sequenzen stromaufwarts des zu 
exprimierenden Gens spezifisch binden und eine charakteristische Wirkung zeigen 
(RNA-Polymerasen, Transkriptionsfaktoren, Hormon-aktivierbare Rezeptoren etc.). 
Bisher sind nur wenige Beispiele fur die Kontrolle der Genexpression direkt uber 
RNA-Molekule bekannt. Dazu zahlen die fur die Inaktivierung des gesamten X-Chro- 
mosoms verantwortliche RNA "XIST" ("X-Chromosome inactivation specific tran- 
script"), eine mit IPW bezeichnete RNA ("imprinted in Prader-Willi syndrome") und die 
RNA H19, die einen Tumorsuppressor darstellt und an der Steuerung bestimmter 
Entwicklungsvorgange beteiligt ist. Die artifizielle Kontrolle der Genexpression wird 
inzwischen durch die Verwendung von spezifisch an mRNAs bindende Antisense- 
RNAs bewirkt bzw. durch die Verwendung katalytisch aktiver RNA-Molekule, so- 
genannter Ribozyme, die an die Ziel-RNA nicht nur spezifisch binden, sondern diese 




auch spalten und somit inaktivieren. Allerdings sind die Einsatzmoglichkeiten fur 
diese Antisense-RNAs bzw. Ribozyme begrenzt, vor allem hinsichtlich des zu binden- 
den und inaktivierenden Liganden, bei dem es sich grundsatzlich nur urn RNA 
handeln kann. 

Somit besteht ein Bedarf nach der Bereitstellung von Verbindungen, die universell 
unterschiedlichste Zielmolekule, beispielsweise DNA, RNA, Proteine oder nieder- 
molekulare Substanzen, erkennen bzw. inaktivieren konnen und beispielsweise fur 
die Kontrolle der Genexpression und damit naturlich auch die Prevention und Be- 
handlung von Krankheiten, die mit einer Storung der Genexpression einhergehen, 
geeignet sind. 



Somit liegt der Erfindung im wesentlichen das technische Problem zugrunde, solche 
Verbindungen bereitzustellen, die unter anderem fur die Prevention oder Therapie 
(und auch Diagnose) von solchen Erkrankungen von Nutzen sind. 

Die Losung dieses technischen Problems wurde durch die Bereitstellung der in den 
Patentanspruchen gekennzeichneten AusfCihrungsformen erreicht. 

Von den Erfindem konnte ein RNA-Molekul identifiziert werden, das die vorstehend 
beschriebenen, erwunschten Eigenschaften aufweist Dieses RNA-Molekul wird durch 
das Gen "NINTROX" (No INTRO ns X-chromosome) kodiert, das keine Introns besitzt, 
auf dem X-Chromosom lokalisiert ist und fur kein Protein kodiert. Dieses RNA-Molekul 
ist Teil von bestimmten (langeren) Transkripten des MeCP2-Gens. Das MeCp2-Gen 
(Methyl-CpG-Bindeprotein 2) in Xq28 weist ein Transkript von ca. 1,8 kb auf, das fur 
das MeCP2-Protein kodiert. Die oben beschriebene RNA ist Teil von langeren 
MeCP2-Transkripten, die auch das MeCP2-Protein kodieren, aber einen unterschied li- 
chen 3'-nicht-translatierten Bereich aufweisen. Dieser 3'-nicht translatierte Bereich hat 
entscheidende Bedeutung fur das MeCP2-Gen und dessen Funktion. Im nachfolgen- 
den ist der Begriff "NINTROX" mit den erwahnten langeren Transkripten des MeCP2- 
Gens gleichbedeutend. 

Die genomische Sequenz des menschlichen NINTROX-Gens ist in Figur 1 gezeigt 
und die genomische Sequenz des murinen NINTROX-Gens in Figur 2. In Figur 3 
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wurde ein Sequenzvergleich zwischen humaner und muriner Sequenz durchgefuhrt. 
Daraus sieht man, daB es einige sehr sequenzkonservierte Bereiche gibt, die sich 
gemaB einer per Computer durchgefuhrten Energieanalyse durch eine hohe Energie 
auszeichnen (vgl. Fig. 4). 

Wahrend der Wirkungsmechanismus der vorstehend diskutierten, auf RNA-Ebene 
wirksamen Gene vollkommen unklar war, konnte durch die Analyse des NINTROX- 
Gens zum ersten Mai das Wirkprinzip eines solchen Gens, das nachstehend genauer 
beschrieben wird, ermittelt werden. Das NINTROX-Gen tragt wesentlich zur Aufrecht- 
erhaltung der Funktionen des ZNS insbesondere des Hippocampus bei. Defekte in 
diesem Gen fuhren zu Einschrankungen der ZNS-Funktionen, die bis zu mentalen 
Retardierungen reichen. Desweiteren ubt das NINTROX-Gen eine wichtige Funktion 
bei der Kontrolle der Zellproliferation aus. Dabei konnen Veranderungen in diesem 
Gen zu Fehlern in der Kontrolle des Zellwachstums, beispielsweise zu Krebs, fuhren. 
Veranderungen in diesem Gen konnen zu einer verstarkten oder verringerten DNA- 
Methylierung fuhren. Eine verstarkte DNA-Methylierung kann unter anderem die 
Aktivitat von wachstumskontrollierenden Genen (Tumorsuppressorgene) einschran- 
ken oder unterbinden und somit zu einer generell erhohten Krebsrate fuhren. Eine 
verringerte DNA-Methylierung kann unter anderem zu einer Uberexpression von 
Genen und damit einhergehend zu Entwicklungsstorungen der Zelle oder des 
Gesamtorganismus fuhren. Die weiteren Untersuchungen ergaben, daB das Ex- 
pressionsmusterdes NINTROX-Gens gewebe- und entwicklungsspezifisch erfolgt. Die 
Northern-Analysen zeigten eine Expression in alien untersuchten fotalen und adulten 
Geweben. Es konnten keine Sequenzhomologien mit bereits bekannten Sequenzen 
festgestellt werden. 

Die Strategie, die zur Identifizierung dieses Nucleinsauremolekuls fuhrte, wird nach- 
stehend beschrieben. Im Rahmen der systematischen Analyse der q28-Region des 
menschlichen X-Chromosoms konnten verschiedene exprimierte Sequenzen nach- 
gewiesen und isoliert werden. Mit Hilfedieser exprimierten Sequenzen konnten einige 
bisher noch nicht bekannte Gene gemaB Standardmethoden identifiziert und charak- 
terisiert werden, u.a. das der vorliegenden Anmeldung zugrunde liegende NINTROX- 
Gen. 
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Interessanterweise zeigen die erfindungsgemaBen NINTROX-RNA-Molekule einen 
modularen Aufbau, d.h., sie sind durch das Vorhandensein von zwei verschiedenen 
Sequenzbereichstypen gekennzeichnet. Wahrend der eine Sequenzbereich die 
Aufrechterhaltung der dreidirnensionalen Struktur erlaubt und, wie .sich durch Ver- 
gleich der Sequenzen aus verschiedenen Spezies (Mensch, Hamster, Kanguruh, 
Makaken, Orang-Utan, Schimpansen und Ratte; vgl. Fig. 5) ergibt, nur bedingt 
konserviert ist, ist der zweite Sequenzbereich, der fur die spezifische Bindung an das 
Zielmolekul verantwortlich ist, sequenzkonserviert Aufgrund dieser modularen 
Bauweise der NINTROX-RNA ist es moglich, diese so zu modifizieren, daB ihre 
Wirkung nicht nur auf die vorstehend beschriebene Kontrolle der Genexpression 
beschrankt ist, sondern fur eine Vielzahl von Moglichkeiten eingesetzt werden kann. 
Neben der Kontrolle der Genexpression kann mit Hilfe solcher modular aufgebauter 
RNA-Molekule auch die Struktur (z.B. Chromatinstruktur, Nuclear-Scaffold) von 
chromosomalen Bereichen verandert werden. Hierdurch ergibt sich die bisher nicht 
gekannte Moglichkeit, die Expression von groBeren genomischen Bereichen gezielt 
beeinflussen zu konnen. So konnen bestimmte Sequenzbereiche der beiden Module 
des NINTROX-Gens durch andere Sequenzen Oder sogar artifizielle Sequenzen 
ersetzt werden, wodurch (a) die Wechselwirkung dieser RNA mit anderen Bindungs- 
partnern (RNA, DNA, andere Makromolekule und niedermolekulare Verbindungen) 
oder deren biochemische Umsetzung (z.B. Erhohung oder Emiedrigung der Um- 
satzrate) gezielt verandert werden, wodurch das RNA-Molekul gezielt neuen Auf- 
gaben angepaBt werden kann, und/oder (b) die dreidimensionale Struktur der 
NINTROX-RNA gezielt spezifischen Anforderungen angepaBt werden kann. Dadurch 
kann eine teilweise oder vollig neuartige Funktion des erfindungsgemaBen NINTROX- 
RNA-Molekuls erzielt werden. 

Somit betrifft eine Ausfuhrungsform der vorliegenden Erfindung ein RNA-Molekul, das 
an einen Liganden binden kann und folgende Sequenzbereiche umfaBt: (a) einen die 
dreidimensionale Struktur des RNA-Molekuls aufrechterhaltenden Sequenzbereich, 
und (b) einen Sequenzbereich fur die spezifische Bindung des Liganden. 

Der hier verwendete Ausdruck "einen die dreidimensionale Struktur des RNA-Mole- 
kuls aufrechterhaltenden Sequenzbereich" besitzt folgenden Begriffinhalt. Dreidimen- 
sionale RNA-Strukturen werden durch Basenpaarung verschiedener Basen innerhalb 
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des RNA-Molekuls ermoglicht. Hierbei werden Strukturen wie "Stems" oder "Loops" 
gebildet. Viele dieser Strukturen ergeben so die Gesamtstruktur des RNA-Molekuls. 
Eine Sequenzanderung innerhalb des RNA-Molekuls kann ohne Folgen fur die 
raumliche Struktur bleiben, wenn die Sequenzveranderung die Basenpaarungen nicht 
verandert oder wenn die Sequenzanderung durch eine zweite Sequenzanderung 
ausgeglichen wird. Wird beispielsweise die Basenpaarung A-T zerstort, indem das A 
zum G mutiert, so kann diese Mutation durch die weitere Mutation des T zum C 
ausgeglichen werden. Dadurch andert sich zwar die Sequenz, aber die raumliche 
Struktur bleibt gleich. Dies hat zur Folge, daB die diesselbe RNA-Struktur durch 
extrem viele unterschiedliche RNA-Sequenzen gebildet werden kann. Hinweise auf 
bestimmte RNA-Strukturen ergibt die Analyse der darin enthaltenen Energie. Diese 
Analyse kann mittels kommerziell erhaltlicher Ctomputerprogramme (z.B. "FOLD"; 
Michael Zuker und P. Stiegler: Optimal Computer Folding of Large RNA Sequences 
using Thermodynamics and Auxiliary Information, Nucleic Acids Research (81), 9(1), 
S. 133) durchgefuhrt werden. Je geringer der Energieinhalt einer bestimmten Se- 
quenz ist, desto stabiler sind die dreidimensionalen RNA-Strukturen. Die Analyse des 
NINTROX-Gens zeigte eine konservierte Verteilung dieser energiearmen Strukturen 
(vgl. Fig. 4). Die Basensequenz dieser RNA-Bereiche sind bei verschiedenen Spezies 
sehr unterschiedlich, der Energieinhalt ist aber auBerst konserviert. In Fig. 3 sind dies 
die Sequenzbereiche, die nicht durch einen schwarzen Balken am Rand gekenn- 
zeichnet sind. Dies bedeutet, daB der die dreidimensionale Struktur des RNA-Mole- 
kuls aufrechterhaltenden Sequenzbereich nicht sequenz-, aber energiekonserviert ist. 
So richten sich Modifikationen dieses Sequenzbereichs auch nicht nach der Basense- 
quenz, sondem nach der Erhaltung des ermittelten Energieinhalts. 

Der hier verwendete Ausdruck "ein Sequenzbereich fur die spezifische Bindung des 
Liganden" betrifft einen Sequenzbereich, der so beschaffen ist, daB er den ge- 
wunschten Liganden spezifisch binden kann. Diese Sequenzbereiche sind sehr 
sequenzkonserviert. In Fig. 3 sind diese Bereiche durch einen schwarzen Balken am 
Rand gekennzeichnet und haben einen hohen Energieinhalt (vgl. Fig. 4). Dies deckt 
sich mit der Beobachtung, daB diese Sequenzbereiche nicht "verpackt" sind, sondem 
nach auBen gerichtet sind und fur die Bindung des Liganden, enzymatische Re- 
aktionen oder die Bindung an andere RNA- oder DNA-Sequenzen verantwortlich sind. 
Falls es sich bei dem zu bindenden Liganden um ein RNA-Molekul oder ein DNA- 
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Molekul handelt, wircl dieser Sequenzbereich zu einem entsprechenden, ausreichend 
langen Abschnitt des RNA-Molekuls oder DNA-Molekuls Komplementaritat aufweisen. 
Falls es sich bei dem zu bindenden Liganden um ein Protein handelt, kann der 
Sequenzbereich (b) ganz oderteilweisedurch eine DNA-Sequenz ausgetauscht oder 
erganzt werden, von der bekannt ist, daB sie das gewunschte Protein spezifisch 
bindet. 

Die beiden oben beschriebenen Sequenztypen kommen mehrere Male innerhalb der 
NINTROX-RNA vor. Der Austausch oder die Veranderung einzelner solcher Module 
ermoglicht die gezielte Veranderung der NINTROX-RNA. So ist bei einer Modifikation 
des die dreidimensionale Struktur aufrechterhaltenden Moduls auf den ermittelten 
Energieinhalt zu achten, sodaB dieser einen minimalen Wert beibehalt. Die Modifika- 
tion des anderen Sequenzbereichs, obwohl dieser gerade als sequenzkonserviert gilt, 
unterliegt nur geringen Beschrankungen. So kann dieser Bereich ganz oder teilweise 
weggelassen werden oder kann Insertionen enthalten. Beispielsweise konnen auch 
Sequenzen in das NINTROX-RNA-Molekul integriert werden, die bekannte bioche- 
mische Eigenschaften aufweisen oder bestimmte DNA-, RNA-Molekule oder Proteine 
binden. Daruber hinaus konnen Zufallssequenzen unterschiedlicher Lange an ver- 
schiedenen Stellen des NINTROX-Gens eingebaut werden und danach kann auf 
spezifische Eigenschaften wie biochemische Umsetzung, spezifische Bindung usw. 
selektioniert werden. 

In einer bevorzugten Ausfuhrungsform des erfindungsgemaBen RNA-Molekuls umfaBt 
der Sequenzbereich (a) die in Figur 3 nicht am Rand gekennzeichneten Sequenz- 
bereiche oder dazu verwandte Sequenzen, die ebenfalls die Aufrechterhaltung der 
dreidimensionalen Struktur des RNA-Molekuls erlauben und von dem Sequenzbe- 
reich (a) in Figur 3 abweicht. Diese Abweichungen betreffen die Addition, Deletion 
und/oder Insertion von Basen, wobei der fur die Sequenz von Figur (3) ermittelte 
Energieinhalt zu mindestens 80 %, vorzugsweise mindestens 85 % und mehr bevor- 
zugt zu mindestens 90 % erhalten bleibt. Vorzugsweise bleibt bei diesen eingefuhrten 
Anderungen die ursprungliche dreidimensionale Struktur erhalten. 

In einer besonders bevorzugten Ausfuhrungsform umfaBt der Sequenzbereich (b) des 
erfindungsgemaBen RNA-Molekuls die in Figur 3 dargestellten Sequenzen, die am 
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Rand mit schwarzen Balken versehen sind. 

In einer weiteren bevorzugten Ausfuhrungsform des erfindungsgemaBen RNA-Mole- 
kuls handelt es sich bei dem zu bindenden Liganden urn ein DNA-Molekul oder ein 
Protein oder Enzym, z.B. DNA-Polymerase I. Vorzugsweise enthalt das erfindungs- 
gemaBe RNA-Molekul eine Poly(A)-Sequenz am 3'-Ende, was zur Stabilitat in einer 
gewunschten Wirtszelle beitragen kann. 

In einer weiteren bevorzugten Ausfuhrungsform wird das erfindungsgemaBe RNA- 
Molekul zur Kontrolle der Genexpression verwendet. Dazu wird der Sequenzbereich 
(b) so modifiziert, daB er ein fur die Genexpression verantwortliches Protein bindet, 
oder an einen bestimmten DNA-Bereich des Zielgens, wodurch beispielsweise die 
Anlagerung von Proteinen, die einen die Genexpression hemmenden oder fordern- 
den EinfluB haben, behindert oder unterbunden wird, oder auch direkt an die mRNA 
des Zielgens, wodurch beispielsweise die Translation behindert oder unterbunden 
wird. Der Fachmann kann ohne weiteres durch entsprechende Modifikationen des 
Sequenzbereichs (b) und evtl. auch des Sequenzbereichs (a) das erfindungsgemaBe 
RNA-Molekul so modifizieren, daB es den gewunschten Liganden bindet und so die 
Genexpression in dem gewunschten MaB kontrolliert. 

Die vorliegende Erfindung betrifft auch eine, das erfindungsgemaBe RNA-Molekul 
kodierende DNA-Sequenz, sowie ein Gen mit folgenden Merkmalen: Es enthalt einen 
Promotor, der die Transkription in einer gewunschten Wirtszelle erlaubt sowie eine 
damit funktionell verknupfte, das erfindungsgemaBe RNA-Molekul kodierende DNA- 
Sequenz. Vorzugsweise enthalt das Gen zusatzlich ein Terminationssignal und eine 
Polyadenylierungsstelle. 

In einer bevorzugten Ausfuhrungsform umfaBt das erfindungsgemaBe Gen die in 
Figur 1 oder 2 dargestellte Sequenz. 

Die das erfindungsgemaBe RNA-Molekul kodierenden DNA-Sequenzen oder Gene 
konnen auch in einen Vektor inseriert werden. Somit umfaBt die vorliegende Erfin- 
dung auch diese DNA-Sequenzen oder Gene enthaltende Vektoren. Die Bezeichnung 
'Vektor" bezieht sich auf ein Plasmid (z.B. pUC18, pBR322, pBlueScript), auf ein 
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Virus Oder ein anderes geeignetes Vehikel. In einer bevorzugten Ausfuhrungsform ist 
die das erfindungsgemaBe DNA-Molekul kodierende Sequenz im Vektor mit regulato- 
rischen Elementen funktionell verknupft, die dessen Expression in prokaryotischen 
oder eukaryotischen Wirtszellen erlauben. Solche Vektoren enthalten neben den 
regulatorischen Elementen, beispielsweise einem Promoter, typischerweise einen 
Replikationsursprung und spezifische Gene, die die phanotypische Selektion einer 
transformierten Wirtszelle erlauben. Zu den regulatorischen Elementen fur die Ex- 
pression in Prokaryonten, beispielsweise E.coli, zahlen der lac-,trp-Promotor oder T7- 
Promotor, und fur die Expression in Eukaryonten der AOX1- oder GAL1-Promotor in 
Hefe, und der CMV-,SV40-,RVS-40-Promotor, CMV- oder SV40-Enhancer fur die 
Expression in tierischen Zellen. Weitere Beispiele fur geeignete Promotoren sind der 
Metallothionein I- und der Polyhedrin-Promotor. Zu geeigneten Vektoren zahlen 
beispielsweise auf T7 basierende Expressionsvektoren fur die Expression in Bakterien 
(Rosenberg et al., Gene 56(1987), 125), pMSXND fur die Expression in Saugerzellen 
(Lee und Nathans, J.Biol.Chem. 263(1 988),3521) und von Baculovirus abgeleitete 
Vektoren fur die Expression in Insektenzellen. 

In einer bevorzugten Ausfuhrungsform ist der die erfindungsgemaBen RNA-Molekule 
kodierenden Sequenzen enthaltende Vektor ein viraler Vektor, beispielsweise ein 
Vaccinia-Virus oder Adenovirus, der bei einer Gentherapie von Nutzen ist. Besonders 
bevorzugt sind RNA-Viren, vor allem Retroviren. Beispiele fur geeignete Retroviren 
sind MoMuLV, HaMuSV, MuMTV, RSV oder GaLV. Fur Zwecke der Gentherapie 
konnen die erfindungsgemaBen RNA-Molekule auch in Form von kolloidalen Disper- 
sionen zu den Zielzellen transportiert werden. Dazu zahlen beispielsweise Liposomen 
oder Lipoplexe (Mannino et al., Biotechniques 6 (1988), 682). 

Allgemeine, auf dem Fachgebiet bekannte Verfahren konnen zur Konstruktion von 
Expressionsvektoren, die die erfindungsgemaBen RNA-Molekule kodierenden Se- 
quenzen und geeignete Kontrollsequenzen enthalten, verwendet werden. Zu diesen 
Verfahren zahlen beispielsweise in vitro-Rekombinationstechniken, synthetische 
Verfahren, sowie in vivo-Rekombinationsverfahren, wie sie beispielsweise in Sam- 
brook et al., beschrieben sind. 

Die vorliegende Erfindung betrifft auch die vorstehend beschriebenen Vektoren 
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enthaltende Wirtszellen. Zu diesen Wirtszellen zahlen Bakterien, Hefe, Insekten- und 
Tierzellen, vorzugsweise Saugerzellen. Bevorzugte Saugerzellen sind CHO-, VERO-, 
BHK-, HeLa-, COS-, MDCK, 293- und WI38-Zellen. Verfahren zur Transformation 
dieser Wirtszellen, zur phanotypischen Selektion von Transformanten und zur Ex- 
pression der erfindungsgemaBen Nucleinsauremolekule unter Verwendung der 
vorstehend beschriebenen Vektoren sind auf dem Fachgebiet bekannt. 



Die vorliegende Erfindung betrifft auch Antikorper, die das erfindungsgemaBe RNA- 
Molekul spezifisch erkennen. Die Antikorper konnen monoclonale, polyclonale oder 
synthetische Antikorper sein oder Fragmente davon, beispielsweise Fab-, Fv-oder 
scFv-Fragmente. Vorzugsweise handelt es sich dabei um einen monoclonalen 
Antikorper. Die erfindungsgemaBen Antikorper konnen gemaB Standardverfahren 
hergestellt werden, wobei das erfindungsgemaBe RNA-Molekul oder ein Fragment 
davon als Immunogen dienen. Monoclonale Antikorper konnen beispielsweise durch 
das von Kohler und Milstein (Nature 256 (1975), 495) und Galfre (Meth. Enzymol.73 
(1981), 3) beschriebene Verfahren hergestellt werden, wobei Maus-Myelomzellen mit 
von immunisierten Saugern stammenden Milzzellen fusioniert werden. Diese Antikor- 
per konnen beispielsweise zur Hemmung der Aktivitat der erfindungsgemaBen RNA- 
Molekule, beispielsweise zur Beeinflussung der Genexpression, verwendet werden. 
Die Antikorper konnen beispielsweise auch in diagnostischen Assays verwendet 
werden, um nachweisen zu konnen, ob eine Dysregulation der Genepression^ 
beispielsweise / dtiW^ Verlust oder Mangel der verantwortlichen NINTROX-RNA 
einhergeht Die Antikorper konnen in Immunassays in Flussigphase vorliegen oder an 
einen festen Trager gebunden werden. Dabei konnen die Antikorper auf verschiedene 
Art und Weise markiert sein. Geeignete Marker und Markierungsverfahren sind auf 
dem Fachgebiet bekannt. Beispiele fur Immunassays sind ELISA und RIA. 

Die Erfindung betrifft femer Antisense-RNAs, die an ein erfindungsgemaBes RNA- 
Molekul spezifisch binden und zur Herabsetzung der Expression von Genen, die 
unter direkter Kontrolle von RNA, beispielsweise NINTROX-RNA, stehen, in vitro oder 
in vivo verwendet werden konnen. Die Verabreichung der erfindungsgemaBen 
Antisense-RNA an eine Zielzelle fuhrt zu einer herabgesetzten Genexpression und ist 
fur die Behandlung von Erkrankungen besonders nutzlich, die durch eine zu hohe 
Genexpression des unter direkter RNA-Kontrolle stehenden Gens gekennzeichnet 
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sind (z.B. bei Krebserkrankungen). Dabei konnen die Antisense-RNAs direkt ver- 
abreicht werden Oder als diese kodierende DNA, vorzugsweise in einen geeigneten 
Vektor inseriert. Zu den geeigneten Vektoren zahlen alle bereits vorstehend in Zusam- 
menhang mit den erfindungsgemaBen RNA-Molekulen beschriebenen Vektoren. 

Die erfindungsgemaBen Antisense-RNAs umfassen eine Antisense-Sequenz mit 
mindestens 7 bis 10 oder mehr Nucleotides die mit einer Sequenz des erfindungs- 
gemaBen RNA-Molekuls, beispielsweise NINTROX-RNA, spezifisch hybridisieren. 
Vorzugsweise weist die erfindungsgemaBe Antisense-RNA eine Lange von etwa 10 
bis etwa 50 Nucleotiden oder von etwa 14 bis etwa 35 Nucleotiden auf. In weiteren 
Ausfuhrungsformen handelt es sich bei den erfindungsgemaBen Antisense-RNAs um 
RNAs, die kurzer als etwa 100 Nucleotide oder kurzer als etwa 200 Nucleotide sind. 
Im allgemeinen sollten die Antisense-RNAs lang genug sein, um eine stabile Doppel- 
helix zu bilden, jedoch kurz genug (in Abhangigkeit von der Art der Zufuhrung) um, 
falls erwunscht, in vivo verabreicht werden zu konnen. Im allgemeinen ist die Antisen- 
se-Sequenz zur Gewahrieistung einer spezifischen Hybrid isierung zu der Ziel-Se- 
quenz im wesentlichen komplementar. In bestimmten Ausfuhrungsformen ist die 
Antisense-Sequenz genau komplementar zu der Zielsequenz. Die Antisense-RNAs 
konnen jedoch auch Nucleotid-Substitutionen, Additionen, Deletionen, Transitioned 
Transpositionen oder Modifikationen enthalten, solange die spezifische Bindung an 
die relevante Zielsequenz als eine funktionelle Eigenschaft der Antisense-RNA 
beibehalten wird. Die Antisense-RNAs konnen auch zusatzlich zu den Antisense- 
Sequenzen weitere Sequenzen enthalten. Die Antisense-RNAs (sowie die erfindungs- 
gemaBen RNA-Molekule) konnen unter Verwendung jedes zur Herstellung von 
Nucleinsauren geeigneten Verfahrens hergestellt werden, beispielsweise durch 
chemische Synthese de novo oder durch Clonierung. Eine Antisense-RNA kann 
beispielsweise auch dadurch hergestellt werden, daB eine Sequenz der Ziel-RNA 
oder eines Fragments davon in umgekehrter Orientierung funktionell mit einem 
Promotor verknupft in einen Vektor (z.B. ein Plasmid) inseriert wird. Unter der Voraus- 
setzung, daB der Promotor und vorzugsweise Terminations- und Polyadenylierungs- 
signale korrekt positioniert sind, wird der Strang der inserierten Sequenz, der dem 
nicht-codierenden Strang entspricht, transkribiert, und dieser wirkt als eine Antisense- 
RNA. 
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Die vorliegende Erfindung betrifft auch Ribozyme, die die erfindungsgemaBen RNA- 
Molekule spezifisch spalten und somit auch zur Hemmung der Genexpression von 
Nutzen sind. Nutzliche Ribozyme konnen 5'- und 3'-terminale Sequenzen umfassen, 
die zu der Ziel-RNA komplementar sind, und diese konnen vom Fachmann nach 
Standardverfahren konstnjiert werden (siehe beispielsweise PCT-Veroffentlichung WO 
93/23572). Zu den erfindungsgemaBen Ribozymen gehoren beispielsweise Ribozyme 
mit den Merkmalen der Gruppe l-lntron-Ribozyme (Cech, Biotechnology 13 (1995), 
323) und "hammerhead ,I -Ribozyme (Edgington, Biotechnology 10 (1992), 256). 

In einer Ausfuhrungsform werden die erfindungsgemaBen Ribozyme per se als 
Arzneimittel verwendet. In einer anderen Ausfuhrungsform werden Gentherapiever- 
fahren zur Expression von Ribozymen in einer Zielzelle ex vivo oder in vivo ange- 
wandt. Die Verfahren zur Verabreichung der Ribozyme bzw. zur Expression der 
Ribozyme in vivo entsprechen den vorstehend in Zusammenhang mit den erfin- 
dungsgemaBen RNA-Molekulen beschriebenen Verfahren. 

Die Isolierung und Charakterisierung des menschlichen NINTROX-Gens und ins- 
besondere des Maushomologs des NINTROX-Gens erlaubt die Etablierung eines 
Tiermodells, das die Bereitstellung von Therapien und Arzneimitteln fur die vor- 
stehend diskutierten Krankheiten erlaubt. Durch die Bereitstellung der Sequenz des 
NINTROX-Gens ist sowohl eine Diagnose (post- oder pranatal) als auch eine Thera- 
pie von Erkrankungen moglich, bei denen die Genexpression durch das Fehlen von 
NINTROX-RNA oder einen UberschuB von NINTROX-RNA gekennzeichnet ist. Die 
therapeutische oder diagnostische Anwendung ist jedoch nicht nur auf Krankheiten 
beschrankt, die mit einer Fehlregulation der Expression eines Gens einhergehen, das 
unter Kontrolle der NINTROX-RNA steht, sondem die entsprechend den vorstehend 
beschriebenen Moglichkeiten veranderten RNA-Molekule bieten daruber hinaus die 
Moglichkeit vollig neuer Therapeutika. 

Die vorliegende Erfindung betrifft somit femer Arzneimittel, die die vorstehend be- 
schriebenen RNA-Molekule, Vektoren, Antikdrper, Antisense-RNAs oder Ribozyme 
enthalten. Diese Arzneimittel enthalten gegebenenfalls zusatzlich einen pharma- 
zeutisch vertraglichen Trager. Geeignete Trager und die Formulierung derartiger 
Arzneimittel sind dem Fachmann bekannt. Zu geeigneten Tragem zahlen beispiels- 
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weise Phosphat-gepufferte Kochsalzlosungen, Wasser, Emulsionen, beispielsweise 
Ol/Wasser-Emulsionen, Netzmittel, sterile Losungen etc. Die Verabreichung der 
Arzneimittel kann oral Oder parenteral erfolgen. Zu den Verfahren fur die parenterale 
Verabreichung gehoren die topische, intra-arterielle (z.B. direkt zu /einem Tumor), 
intramuskulare, subkutane, intramedullare, intrathekale, intraventrikulare, intravenose, 
intraperitoneale oder intranasale Verabreichung. Die geeignete Dosierung wird von 
dem behandelnden Arzt bestimmt und hangt von verschiedenen Faktoren ab, bei- 
spielsweise von dem Alter, dem Geschlecht, dem Gewicht des Patienten, dem 
Stadium eines Tumors, der Art der Verabreichung etc.. 

Vorzugsweise wird das erfindungsgemaBe Arzneimittel zur Prevention oder Be- 
handlung von Erkrankungen verwendet, die mit einer Storung der Kontrolle der 
Genexpression in Zusammenhang stehen. Besonders bevorzugt wird das erfin- 
dungsgemaBe Arzneimittel zur Behandlung von Tumorerkrankungen oder Erkran- 
kungen des ZNS verwendet. Dabei kann das Arzneimittel in der Gentherapie Verwen- 
dung finden, wobei die vorstehend beschriebenen Verfahren bzw. Vektoren zur 
Einschleusung der erfindungsgemaBen Nucleinsauren Anwendung finden konnen. 
Andererseits kann das erfindungsgemaBe RNA-Molekiil direkt verabreicht werden, um 
so in Zellen, die keine funktionalen Kopien des RNA-Molekuls mehr besitzen, normale 
Expression des Gens wiederherzustellen. 

Die vorliegende Erfindung betrifft ferner eine diagnostische Zusammensetzung, die 
das erfindungsgemaBe RNA-Molekul, die dieses kodierende DNA-Sequenz oder ein 
Fragment davon, den erfindungsgemaBen Antikorper oder ein Fragment davon, oder 
die erfindungsgemaBe Antisense-RNA oder ein Fragment davon enthalt oder Kombi- 
nationen davon, gegebenenfalls zusammen mit einem geeigneten Nachweismittel. 
Mittels dieser diagnostischen Zusammensetzung kann der Nachweis daruber erfol- 
gen, ob die direkt die Genexpression steuemde RNA, beispielsweise NINTROX-RNA 
vorhanden ist oder im Vergleich zu einer Kontrolle in zu hoher oder niedriger Konzen- 
tration oder mit einer abweichenden Lange vorliegt. Dabei wird vorzugsweise der 
Antikorper oder ein Fragment davon in den vorstehend beschriebenen Assays oder 
die Antisense-RNA oder ein Fragment davon als Sonde in Hybridisierungsexperimen- 
ten verwendet. Vorzugsweise weist dazu die Sonde eine Lange von mindestens 10, 
besonders bevorzugt mindestens 15 Basen auf. Geeignete, auf Hybridisierung 
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basierende Nachweisverfahren sind dem Fachmann bekannt. Geeignete Markierun- 
gen fur die Sonde sind dem Fachmann ebenfalls bekannt und dazu zahlen beispiels- 
weise Markienjng mit Radioisotope^ Biolumineszenz-, Chemilumineszenz-, Fluo- 
reszenzmarkern, Metal Ichelaten, Enzymen etc. Bei diesem Verfahren konnen dem 
Fachmann bekannte Methoden bezuglich der Praparation von Gesamt-RNA bzw. 
poly(A)+RNA aus biologischen Proben, der Auftrennung der RNAs auf nach GroBe 
auftrennenden Gelen, beispielsweise denaturierenden Agarosegelen, der Herstellung 
und Markierung der Sonde und des Nachweises der Hybride, beispielsweise uber 
"Northern-Blot"; angewandt werden. Vorzugsweise erfolgt dabei die Diagnose von 
Erkrankungen, wie sie vorstehend im Zusammenhang mit den erfindungsgemaBen 
Arzneimitteln beschrieben wurden. 

Eine Diagnose kann auch auf DNA-Ebene erfolgen. Dabei wird mit den vorstehend 
beschriebenen Nucleinsauremolekulen die Intaktheit des Gens, das die an der 
Regulation der Genexpression direkt beteiligte RNA, beispielsweise NINTROX-RNA, 
kodiert untersucht (beispielsweise hinsichtlich Vorhandensein, Lange oder Mutatio- 
nen). Bei diesem Verfahren konnen dem Fachmann bekannte Methoden bezuglich 
der Praparation von DNA aus biologischen Proben, des Restriktionsverdaus der DNA, 
der Auftrennung der Restriktionsfragmente auf nach GroBe auftrennenden Gelen, 
beispielsweise Agarosegelen, der Herstellung und Markierung der Sonde und des 
Nachweises der Hybridisierung, beispielsweise uber "Southern-Blot"; angewandt 
werden. Der vorstehend e Nachweis kann auch uber PCR durchgefuhrt werden. Dabei 
werden Primer verwendet, die die kodierende Sequenz flankieren. Diagnostisch von 
Bedeutung sind dabei Amplifikationsprodukte von DNA aus dem fraglichen Gewebe, 
die sich, beispielsweise hinsichtlich ihrer Lange oder Sequenz, von den Arnplifika- 
tionsprodukten von DNA aus gesundem Gewebe unterscheiden. 

Gegenstand der vorliegenden Erfindung ist ferner ein nicht-menschliches Saugetier, 
dessen NINTROX-Gen verandert ist, z.B. durch Insertion einer heterologen Sequenz, 
insbesondere einer Selektionsmarkersequenz. 

Der Ausdruck "nicht-menschliches Saugetier" umfaBt jegliches Saugetier, dessen 
NINTROX-Gen verandert sein kann. Beispiele solcher Saugetiere sind Maus, Ratte, 
Kaninchen, Pferd, Rind, Schaf, Ziege, Affe, Schwein, Hund und Katze, wobei Maus 
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Kaninchen, Pferd, Rind, Schaf, Ziege, Affe, Schwein, Hund und Katze, wobei Maus 
bevorzugt ist. 

Der Ausdruck "NINTROX-Gen, das verandert ist" bedeutet, daB in; dem im nicht- 
menschlichen Saugetier naturlich vorkommenden NINTROX-Gen durch Standardme- 
thoden eine Deletion von ca. 1-2 kb durchgefuhrt. In diese Deletion kann, falls 
gewunscht, eine heterologe Sequenz, z.B. ein Konstrukt zur Vermittlung von Antibioti- 
ka-Resistenz (z.B. eine "neo-Kassette") eingefugt wird. Diese Methode ist allgemein 
in Schwartzberg et al., Proc. Natl. Acad. Sci. USA, Vol. 87, S. 3210-3214, 1990 
beschrieben, worauf hier Bezug genommen wird. 

Ein weiterer Gegenstand der vorliegenden Erfindung sind Zellen, die aus dem 
vorstehenden nicht-menschlichen Saugetier erhalten werden. Diese Zellen konnen in 
jeglicher Form vorliegen, z.B. in einer Primar- oder Langzeit-Kultur. 

Ein erfindungsgemaBes nicht-menschliches Saugetier kann durch ubliche Verfahren 
bereitgestellt werden. Gunstig ist ein Verfahren, das folgende Schritte umfaBt: 

(a) Herstellung eines DNA-Fragments, insbesondere eines Vektors, enthaltend ein 
verandertes NINTROX-Gen, wobei das NINTROX-Gen durch Deletion einer 
homologen Sequenz und/oder Insertion einer heterologen Sequenz, ins- 
besondere eines selektierbaren Markers, verandert worden ist; 

(b) Preparation embryonaler Stammzellen aus einem nicht-menschlichen Sauger 
(bevorzugt Maus); 

(c) Transformation der embryonalen Stammzellen von Schritt (b) mit dem DNA- 
Fragment von Schritt (a), wobei das NINTROX-Gen in den embryonalen 
Stammzellen durch homologe Rekombination mit dem DNA-Fragment von (a) 
verandert wird, 

(d) Kultivieren der Zellen von Schritt (c), 

(e) Selektion der kultivierten Zellen von Schritt (d) auf das Fehlen der homologen 
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Sequenz bzw. Vorhandensein der heterologen Sequenz, insbesondere des 
selektierbaren Markers, 

(f) Erzeugen chimerer nicht-menschlicher Sauger aus den Zellen von Schritt (e) 
durch Injektion dieser Zellen in Sauger-Blastocysten (bevorzugt Maus-Blasto- 
zyten), Ubertragen der Blastozysten in pseudo-schwangere weibliche Sauger 
(bevorzugt Maus) und Analyse der erhaltenen Nachkommen auf eine Ver- 
anderung des NINTROX-Gens. 

In Schritt (c) wird der Mechanismus der homologen Rekombi nation (vgl. R.M. Torres, 
R. Kuhn, Laboratory Protocols for Conditional Gene Targeting, Oxford University 
Press, 1997) ausgenutzt, urn embryonale Stammzellen zu transfizieren. Die homologe 
Rekombination zwischen den in einem Chromosom vorhandenen DNA-Sequenzen 
und neuen, hinzugefugten clonierten DNA-Sequenzen ermoglicht das Einfugen eines 
klonierten Gens in das Genom einer lebenden Zelle anstelle des ursprtinglichen 
Gens. Mit dieser Methode konnen bei Verwendung embryonaler Keimzellen via 
Chimaren Tiere erhalten werden, die fur das gewunschte Gen oder den gewunschten 
Genteil oder die gewunschte Mutation homozygot sind. 

Der Ausdruck "embryonale Stammzellen" betrifft jegliche embryonalen Stammzellen 
eines nicht-menschlichen Saugetiers, die sich zur Mutierung des NINTROX-Gens 
eignen. Vorzugsweise sind die embryonalen Stammzellen von der Maus, insbesonde- 
re die Zellen E14/1 oder 129/SV. 

Der Ausdruck "Vektor" umfaBt jeglichen Vektor, der durch Rekombination mit der 
DNA von embryonalen Stammzellen eine Veranderung des NINTROX-Gens er- 
moglicht. Vorzugsweise weist der Vektor einen Marker auf, mit dem auf vorhandene 
Stammzellen selektioniert werden kann, in denen die gewunschte Rekombination 
erfolgt ist. Ein solcher Marker ist z.B. die loxP/tkneo-Cassette, die mit Hilfe des 
Cre/loxP-Systems wieder aus dem Genom entfernt werden kann. 

Desweiteren kennt der Fachmann Bedingungen und Materialien, urn die Schritte (a)- 
(f) durchzufuhren. 
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Mit der vorliegenden Erfindung wird ein nicht-menschliches Saugetier bereitgestellt, 
dessen NINTROX-Gen verandert ist. Diese Veranderung kann ein Ausschalten der 
Genexpression-regulierenden Funktion sein. Mit einem solchen Saugetier bzw. Zellen 
daraus kann selektiv die Genexpression-kontrollierde Funktion von NINTROX unter- 
sucht werden. Ferner ist es hiermit moglich, Substanzen, Arzneimittel und Therapie- 
ansatze zu finden, mit denen selektiv auf die kontrollierde Funktion von NINTROX 
eingewirkt werden kann. Daher liefert die vorliegende Erfindung eine Basis, um auf 
die verschiedensten Erkrankungen einzuwirken. Solche Erkrankungen sind z.B. 
Einschrankungen der ZNS-Funktionen, die bis zu mentalen Retardierungen reichen 
oder die Induktion von Krebs durch Fehler bei der Kontolle der Zellproliferation. 
Femer sollte es moglich sein, die Rolle des Hippocampus naher zu untersuchen und 
zu charakterisieren. 

Die folgenden Klone wurden am 4. Mai 1998 bei der DSMZ, Deutsche Sammlung von 
Mikroorganismen und Zellkulturen GmbH, Mascheroder Weg 1b, D-38124 Braun- 
schweig, hinterlegt: 

DSM 12153: E.coli JFC-484, Teilsequenz der humanen NINTROX-cDNA 
DSM 12154: E.coli JFC-622, Teilsequenz der murinen NINTROX-cDNA 
DSM 12155: E.coli JFC-8D3, Sequenz der humanen genomischen NINTROX- 
DNA 

DSM 12156: E.coli JFC-P1-165, Sequenz der murinen genomischen NIN- 
TROX-DNA 

Die Figuren zeigen: 

Figur 1 : Humane Sequenz des NINTROX-Gens 
Figur 2: Murine Sequenz des NINTROX-Gens 

Figur 3: Sequenzvergleich humane (oben) und murine (unten) Sequenz 
durchgezogener Balken: Sequenzkonservierte Bereiche (b) 



Figur 4: 



Energiediagramm der Sequenzen aus Fig. 3 
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Figur 5: Homologievergleich von NINTROX aus verschiedenen Spezies 
Fig. 5a: Teilsequenz aus dem Hamster 
Fig. 5b: Teilsequenz aus dem Kanguruh 
Fig. 5c: Teilsequenz aus dem Makaken 
Fig. 5d: Teilsequenz aus dem Orang-Utan 
Fig. 5e: Teilsequenz aus der Ratte 
Fig. 5f: Teilsequenz aus dem Schimpanzen 



Das folgende Beispiel erlautert die Erfindung: 



Beispiel 1: Identifizierung und Charakterisierung des NINTROX-Gens 

Zur Identifikation von transkribierten Sequenzen aus der Region Xq2- 
7.3 bis Xqter wurde zunachst aus verschiedenen Geweben des Sch- 
weins (Niere, Herz, MHz, Leber, Gehirn usw.) Gesamt-RNA isoliert und 
mit Hilfe von Oligo-dT in Erststrang-cDNA uberschrieben. Diese kom- 
plexen cDNA-Proben, die alle in dem jeweiligen Gewebe trans- 
kribierten Gene reprasentieren, wurden dann radioaktiv markiert und 
mit der Xq27.3-Xqter spezifischen Cosmid-Bibliothek hybridisiert. Die 
Cosmid-Bibliothek wurde dabei in Form von systematisch auf Nylon- 
membranen angeordneten Cosmid-Klonen analysiert. AnschlieBend 
wurde von den Cosmid-Klonen, die mit den komplexen cDNA-Proben 
positive Hybridisierungssignale aufwiesen, die Cosmid-DNA isoliert, 
mit EcoRI verdaut, durch Gelelektrophorese getrennt und auf Nylon- 
membranen transferiert. Die Restriktionsfragmente, die dann eine po- 
sitive Hybrid isierung mit den komplexen, radioaktiv markierten cDNA- 
Proben aufwiesen, wurden dann isoliert und radioaktiv markiert und 
zum Durchsuchen einer fotalen humanen cDNA-Bank verwendet. Hie- 
rdurch konnten positive cDNA-Klone isoliert werden, die das Trans- 
kript des NINTROX-Gens reprasentierten. 
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Patentanspruche 

1. RNA-Molekul, das an einen Liganden binden kann und folgende Sequenz- 
bereiche umfaBt: 

(a) einen die dreidimensionale Struktur des RNA-Molekuls aufrechterhal- 
tenden Sequenzbereich; und 

(b) einen Sequenzbereich fur die spezifische Bindung des Liganden. 

2. RNA-Molekul nach Anspruch 1, wobei der Sequenzbereich (a) die in Figur 3 
ohne Balken am Rand dargestellte abgeleitete DNA-Sequenz umfaBt Oder 
eine dazu verwandte Sequenz, die ebenfalls die Aufrechterhaltung der drei- 
dimensionalen Struktur des RNA-Molekuls erlaubt 

3. RNA-Molekul nach Anspruch 1 oder 2, wobei der Sequenzbereich (b) die in 
Figur 3 mit Balken am Rand dargestellte abgeleitete DNA-Sequenz umfaBt. 

4. RNA-Molekul nach einem der Anspruche 1 bis 3, wobei der Ligand ein 
DNA-Molekul oder ein Protein ist. 

5. RNA-Molekul nach einem der Anspruche 1 bis 4, das zusatzlich eine Po- 
ly(A)-Sequenz am 3'-Ende enthalt 

6. RNA-Molekul nach einem der Anspruche 1 bis 5 zur Kontrolle der Genex- 
pression. 

7. DNA-Sequenz, die ein RNA-Molekul nach einem der Anspruche 1 bis 6 ko- 
diert. 

8. Gen, das die in Figur 1 oder 2 dargestellte Sequenz umfaBt. 

9. Vektor, der die DNA-Sequenz nach Anspruch 7 oder das Gen nach An- 
spruch 8 enthaltend. 
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10. Vektor nach Anspruch 9, wobei der Vektor ein Plasmid ist. 

1 1 . Vektor nach Anspruch 10, wobei der Vektor ein viraler Vektor ist. 

12. Vektor nach Anspruch 11, der ein RNA-Virus ist. 

13. Vektor nach Anspruch 12, der ein Retrovirus ist. 

14. Wirtszelle, den Vektor nach einem der Anspruche 9 bis 13 enthaltend. 

15. Wirtszelle nach Anspruch 14, wobei die Wirtszelle eine Saugerzelle ist. 

16. Antikorper oder ein Fragment davon, die ein RNA-Molekul nach einem der 
Anspuche 1 bis 6 spezifisch binden. 

17. Antikorper nach Anspruch 16, wobei der Antikorper ein monoklonaler Anti- 
korper ist. 

18. Antisense-RNA, die an ein RNA-Molekul nach einem der Anspruche 1 bis 6 
spezifisch bindet. 

19. Ribozym, das ein RNA-Molekul nach einem der Anspruche 1 bis 6 spezi- 
fisch spaltet 

20. Verwendung des RNA-Molekuls nach einem der Anspruche 1 bis 6, des 
Vektors nach einem der Anspruche 9 bis 13, des Antikorpers oder des Frag- 
ments davon nach Anspruch 16 oder 17, der Antisense-RNA nach Anspruch 
18 oder des Ribozyms nach Anspruch 19 zur Herstellung eines Arzneimittels 
zur Prevention oder Behandlung von Krankheiten, die mit einer Storung der 
Kontrolle der Genexpression in Zusammenhang stehen. 



21. 



Verwendung des RNA-Molekuls nach einem der Anspruche 1 bis 6, der 
DNA-Sequenz nach Anspruch 7 oder eines Fragments davon, des Antikorp- 
ers oder des Fragments davon nach Anspruch 16 oder 17, oder der Anti- 
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sense-RNA nach Anspruch 18 Oder eines Fragments davon zur Diagnose 
von Krankheiten, die mit einer Storung der Kontrolle der Genexpression in 
Zusammenhang stehen. 



22. Verwendung nach Anspruch 20 oder 21, wobei es sich bei der Krankheit urn 
eine Tumorerkrankung oder einer Erkrankung des Zentralnervensystems 
handelt. 



23. Nicht-menschliches Saugetier, dessen NINTROX-Gen durch Deletion einer 
homologen Sequenz und/oder Insertion einer heterologen Sequenz veran- 
dert ist. 



24. Nicht-menschliches Saugetier nach Anspruch 23, wobei die heterologe Se- 
quenz eine Selektionsmarkersequenz ist. 

25. Nicht-menschliches Saugetier nach Anspruch 23 oder 24, wobei die Se- 
lektionsmarkersequenz Resistenz gegen Neomycin vermittelt. 

26. Verfahren zur Herstellung eines nicht-menschlichen Saugetiers nach einem 
der Anspruche 23-25 gekennzeichnet durch die folgenden Schritte: 



(a) Herstellung eines DNA-Fragments, insbesondere eines Vektors, ent- 
haltend ein verandertes NINTROX-Gen, wobei das NINTROX-Gen 
durch Deletion einer homologen Sequenz und/oder Insertion einer 
heterologen Sequenz, insbesondere eines selektierbaren Markers, 
verandert word en ist; 

(b) Preparation embryonaler Stammzellen aus einem nicht-menschlichen 
Sauger (bevorzugt Maus); 

(c) Transformation der embryonalen Stammzellen von Schritt (b) mit dem 
DNA-Fragment von Schritt (a), wobei das NINTROX-Gen in den em- 
bryonalen Stammzellen durch homologe Rekombination mit dem 
DNA-Fragment von (a) verandert wird, 
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(d) Kultivieren der Zellen von Schritt (c), 

(e) Selektion der kultivierten Zellen von Schritt (d) auf das Fehlen der 
homologen Sequenz und/oder Vorhandensein der heterologen Se- 
quenz, insbesondere des selektierbaren Markers, 

(f) Erzeugen chimerer nicht-menschlicher Sauger aus den Zellen von 
Schritt (e) durch Injektion dieser Zellen in Sauger-Blastocysten (be- 
vorzugt Maus-Blastozyten), Ubertragen der Blastozysten in pseudo- 
schwangere weibliche Sauger (bevorzugt Maus) und Analyse der er- 
haltenen Nachkommen auf eine Veranderung des NINTROX-Gens. 
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Zusammenfassung 



Beschrieben werden modular aufgebaute RNA-Molekule, die an einen Ugan- 
dan binden konnen und durch zwei Sequenzbereiche gekennzeichnet sind, 
einen ersten Sequenzbereich, derzur Aufrechterhaltung derdreidimensionalen 
Struktur des RNA-Molekuls beitragt, und einen zweiten Sequenzbereich, der 
fur die spezifische Bindung des Liganden verantwortlich ist. Diese RNA-Mole- 
kule, beispielsweise die N1NTROX-RNA, konnen zur direkten Beeinflussung der 
Genexpression verwendet werden. Beschrieben werden ferner die erfindungs- 
gemaBen RNA-Molekule enthaltende Vektoren sowie Arzneimittel und diagno- 
stische Zusammensetzungen, die die vorstehenden RNA-Molekule bzw. 
Vektoren enthalten, ein diese RNA-Molekule spezifisch erkennender Antikorper 
bzw. spezifisch an diese RNA-Molekule bindende Antisense-RNA oder diese 
RNA-Molekule spaltende Ribozyme. AuBerdem betrifft die Erfindung nicht- 
menschliche Sauger, deren NINTROX-Gen durch Insertion einer heterologen 
Sequenz verandert ist und daraus erhaltene Zellen. 
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Humane Sequenz des Nicht kodierenden RNA-Geris (einschlieSlich des putati 
Promotors) 

1 C TTAG AG TTT CGTGGCTTCA GGGTGGGAGT AGTTGGAGCA TTGGGGATGT 
51 TTTTCTTACC GACAAGCACA GTCAGGTTGA AGACCTAACC AGGGCCAGAA 
101 GTAGCTTTGC ACTTTTCTAA ACTAGGCTCC TTCAACAAGG CTTGCTGCAG 
151 ATACTACTGA CCAGACAAGC TGTTGACCAG GCACCTCCCC TCCCGCCCAA 
2 01 ACCTTTCCCC CATGTGGTCG TTAGAGACAG AGCGACAGAG CAGTTGAGAG 

2 51 GACACTCCCG TTTTCGGTGC CATCAGTGCC CCGTCTACAG CTCCCCCAGC 

3 01 TCCCCCCACC TCCCCCACTC CCAACCACGT TGGGACAGGG AGGTGTGAGG 
3 51 CAGGAGAGAC AGTTGGATTC TTTAGAGAAG ATGGATATGA CCAGTGGCTA 
401 TGGCCTGTGC GATCCCACCC GTGGTGGCTC AAGTCTGGCC CCACACCAGC 
451 CCCAATCCAA AACTGGCAAG GACGCTTCAC AGGACAGGAA AGTGGCACCT 
501 GTCTGCTCCA G C TC TGG C AT GGCTAGGAGG GGGGAGTGCC TTGAACTACT 

5 51 GGGTGTAGAC TGGC C TG AAC CACAGGAGAG G ATGGC C C AG GGTGAGGTGG 
501 CATGG TC CAT TCTCAAGGGA CGTCCTCCAA GGGGTGGZGC TAGAGGCCAT 

6 51 GG.-GGGAG TA GG AC AAGGTG CAGGCAGGCT GGCCTGGGGT CAGGCCGGGC 

7 01 AGAGCACAGC GGGGTGAGAG GGATTCCTAA TCACTCAGAG CAGTCTGTGA 

7 51 CTTA.GTGGAC AGGGGAGGGG GCAAAGGGGC- AGGA.GAAGAA AATGTTCTTC 

8 01 CAGTTACTTT CCAATTCTCC TTTAGGGACA- GCTTAGAATT ATTTGCACTA 
851 TTGAGTCTTC A.TGTTC C C AC TTCAAAACAA ACAGATGCTC TGAGAGCAAA 
901 CTGGCTTGAA TTGGTGACAT TTAGTCCCTC AAGCCACCAG ATG TG AC AG T 
951 GTTGAGAACT AC C TGG AT TT G TATA TAT AC CTGCGCTTGT TTTAAAGTGG 

10 01 G C TC AG C AC A. TAGGGTTCCC ACGAAGCTCC GAAACTCTAA GTGTTTGCTG 
1051 CAATTTTATA AGGACTTCCT GATTGGTTTC TCTTCTCCCC TTCCATTTCT 
1101 GCCTTTTGTT CATTTCATCC TTTCACTTCT TTCCCTTCCT CCGTCCTCCT 
1151 CCTTCCTAGT TC ATC C C TTC TCTTCCAGGC AGCCGCGGTG CCCAACCACA 
1201 CTTGTCGGCT CCAGTCCCCA GAACTCTGCC TGCCCTTTGT CCTCCTGCTG 

12 51 CCAGTACCAG CCCCACCCTG TTTTGAGCCC TGAGGAGGCC TTGGGCTCTG 

13 01 CTGAGTCCAA CCTGGCCTGT CTGTGAAGAG CAAGAGAGCA GCAAGGTCTT 

13 51 GCTCTCCTAG GTAGCCCCCT CTTCCCTGGT AAGAAAAAGC AAAAGGCATT 
1401 TCCCACCCTG AACAACGAGC CTTTTCACCC TTCTACTCTA GAGAAGTGGA 

14 51 CTGGAGGAGC TGGGCCCGAT TTGGTAGTTG AGGAAAGCAC AGAGGCCTCC 
1501 TGTGGCCTGC CAGTCATCGA GTGGCCCAAC AGGGGCTCCA TGCCAGCCGA 
1551 CCTTGACCTC ACTCAGAAGT CCAGAGTCTA GCG TAG TGC A GCAGGGCAGT 
1601 AGCGGTACCA ATGCAGAACT CCCAAGACCC GAGCTGGGAC CAGTACCTGG 
1651 GTCCCCAGCC CTTCCTCTGC TCCCCCTTTT CCCTCGGAGT TCTTCTTGAA 
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1701 TGGCAATGTT TTGCTTTTGC TCGATGCAGA C AGGGGGC C A GAACACCACA 
1751 CATTTCACTG TCTGTCTGGT CCATAGCTGT GGTGTAGGGG CTTAGAGGCA 
1801 TGGGCTTGCT GTGGGTTTTT AATTGATCAG TTTTCATGTG GGATCCCATC 
1851 TTTTTAACCT CTGTTCAGGA AGTCCTTATC TAGCTGCATA TCTTCATCAT 
1901 ATTGGTATAT CCTTTTCTGT GTTTACAGAG ATGTCTCTTA T A.TC TA-AATC 
1951 TGTCCAACTG AGAAGTACCT TATCAAAGTA GCAAATGAGA CAGCAGTCTT 
2001 ATGCTTCCAG AAACACCCAC AGGCATGTCC CATGTGAGCT GCTGCCATGA 
2 051 ACTGTCAAGT GTGTGTTGTC TTGTGTATTT CAGTTATTGT CCCTGGCTTC 
2101 CTTACTATGG TGTAATCATG AAGGAGTGAA AC ATC AT AG A AACTGTCTAG 
2151 CACTTCCTTG CCAGTCTTTA GTGATCAGGA ACCATAGTTG ACAGTTCCAA 
22C1 TCAGTAGCTT A^.GAAAAAAC GGTGTTTGTC TCTTC TGG AA. TGGTTAGAAG 
22 51 TGAGGGAGTT TGCCCCGTTC TC-TTTGTAGA GTCTCATAGT TGGACTTTCT 
2 2 01 AGCATATATG TGTCCATTTC CTTATGCTGT AAAAGCAAGT CCTGCAACCA 
22 El AACTCCCATC AGCCCAATCC CTGATCCCTG ATCCCTTCCA CCTGCTCTGC 
2 401 TGATGACCCC CCCAGCTTCA CTTCTGACTC TTGCCCkGGA AGGGAAGGGG 
2451 GG TC AG AAG A GAGGGTGAGT CCTCCAGAAC TCTTCCTCCA AGGACAGAAG 
2 5 01 GCTCCTGCCC CCATAGTGGC CTCGAACTCC TGGCACTACC AAAGG A.C AC T 
25 51 TATCCACGAG AGCGCAGCAT CCGACCAGGT TG TC AC TG AG A_AG ATG TTT A 
2 501 TTTTGG TC AG TTGGGTTTTT ATG T ATT AT A C TT AG TC AAA. TGTAATGTGG 
2 6 51 CTTCTGGAAT CATTGTCCAG AGCTGCTTCC CCGTCACCTG GGCGTCATCT 
27 01 GGTCCTGGTA AGAGGAGTGC GTGGCCCACC AGGCCCCCCT G TC A.C CC ATG 
27 51 ACAGTTCATT CAGGGCCGAT GGGGCAGTCG TGG TTGGG AA. CACAGCATTT 
2 801 CAAGCGTCAC TTTATTTCAT TCGGGCCCCA CCTGCAGCTC CCTCAAAGAG 
2S51 GCAGTTGCCC AGCCTCTTTC CCTTCCAGTT TATTCCAGAG GTGGGAGTGG 

2 901 GGCCTGAGGC TCCTTAGGGT TTTCTCTCTA TTTCCCCCTT TCTTCCTCAT 
29 51 TCCCTCGTCT TTCCC AAAGG CATCACGAGT CAGTCGCCTT TCAGCAGGCA 

3 0C1 GCGTTGGGGG TTTATCGCCC TGGCAGGCAG GGGCCCTGCA GCTCTCATGC 
3 051 TGGZCCTGGC TTGGC-GTCAG GTTGACAGGA GGTTGGAGGG AAAGCCTTAA 
3101 GCTGCAGGAT TCTCACCAGC TGTGTCCGGC CC AG TTTTGG GGTCTGACCT 
3151 CAATTTCAAT TTTGTCTGTA CTTGAACATT ATGAAGATGG GGGCCTCTTT 
3 201 CAGTGAATTT GTGAACAGCA GAATTGACCG ACAGCTTTCC AGTACCCATG 
32 51 GGGCTAGGTC ATTAAGGCCA CATCCACAGT CTCCCCCACC CTTGTTCCAG 
3 2 01 TTGTTAGTTA CTACCTCCTC TC CTG AC AAT ACTGTATGTC GTCGAGCTCC 
3 3 51 CCCCAGGTCT ACCCCTCCCG GCCCTGCCTG CTGGTGGGCT TGTCATAGCC 
3401 AG TGGG ATTG CCGGTCTTGA CAGCTCAGTG AGCTGGAGAT ACTTGGTCAC 
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3451 AGCCAGGCGC TAGCACAGCT CCCTTCTGTT GATGCTGTAT TCCCATATCA 
3501 AAAGGCACAG GGGACACCCA GAAACGCCAC ATCCCCCAAT CCATCAGTGC 
3 5 51 CAAACTAGCC AACGGCCCCA GCTTCTCAGC TCGCTGGATG GCGGAAGCTG 
3 601 CTACTCGTGA GCGCCAGTGC. GGGTGCAGAC AATCTTCTGT TGGGTGGCAT 
3 651 CATTCCAGGC CCGAAGCATG AACAGTGCAC CTGGGACAGG GAGCAGCCCC 
3 701 AAATTGTCAC CTGCTTCTCT GCCCAGCTTT TCATTGCTGT GACAGTGATG 
3 7 51 GCGAAAGAGG GTAATAACCA GACACAAACT GCCAAGTTGG GTGGAGAAAG 
3 801 GAGTTTCTTT AGCTC-ACAGA ATCTCTGAAT TTTAAATCAC TTAGTAAGCG 
3 3 51 GCTCAAGCCC AGGAGGGAGC AGAGGGATAC GAGCGGAGTC GCCTGCGCGG 
3 9 01 GACCATCTGG AATTGGTTTA GCCCAAGTGG AGCCTGACAG CCAGAACTCT 

3 951 GTGTCCCCCG TCTAACCA.CA GCTCCTTTTC CAGAGCATTC CAGTCAGGCT 
4001 CTCTGGGCTG AC TGGGCC AG GGGAGG TTAC AGG T AC C AG T TCTTTAAGAA 

4 051 GATCTTTGGG CAT AT AC ATT TTTAGCCTGT GTCATTGCCC CAAATGGATT 
4101 CCTGTTTCAA GTTCACACCT GCAGATTCTA GGACCTGTGT C C TAG ACTTC 
4151 AGGGAGTCAG CTGTTTCTAG AG TT C C T AC C ATGG AG TGGG TCTGGAGGAC 
42 01 CTGCCCGGTG GGGGGGCAGA GCCCTGCTCC CTCCGGGTCT TCCTACTCTT 

42 51 CTCTCTGCTC TGACGGGATT TGTTGATTCT CTCCATTTTG GTGTCTTTCT 

43 01 C TTTT AG AT A TTGTATCAAT CTTTAGAAAA GGCATAGTCT AC TTG TTATA 
43 51 AATCGTTAGG AT AC TGCCTC CCCCAGGGTC T AAAATTAC A TATTAGAGGG 
4401 GAAAAGCTGA ACACTGAAGT CAGTTCTCAA CAATTTAGAA GGAAAACCTA 
4451 GAAAACATTT GGCAGAAAAT TACATTTCGA TGTTTTTGAA TGAATACAAG 
4501 CAAGCTTTTA CAACAGTGCT GATCTAAAAA TACTTAGCAC TTGGCCTGAG 
45 51 ATGCCTGGTG AGCATTACAG GCAAGGGGAA TCTGGAGGTA GCCGKCC TG A 
4501 GGACATGGCT TCTGAACCTG TCTTTTGGGA GTGC-TATGGA AGG TGGAGCG 
45 51 TTCACCAGTG ACCTGGAAGG CCCAGCACCA CCCTCCTTCC CACTCTTCTC 
47 01 A TC TTG AC AG AGCCTGCZZZ AGCGCTGACG TG TC AG G AAA ACACCCAGGG 

47 51 AACTAGGAAG GC AC TTCTGC C TG AGGGGC A GCCTGCGTTG CCCACTCCTG 
4801 CTCTGCTCGC CTCGGATCAG CTGAGCCTTC TGAGCTGGCC TCTCACTGCC 

48 51 TCCCCAAGGC CCCCTGCCTG CCCTGTCAGG AGGCAGAAGG AAGCAGGTGT 
4901 GAGGGCAGTG CAAGGAGGGA GCACAACCCC CAGCTCCCGC TCCGGGCTCC 
4951 GACTTGTGCA CAGGCAGAGC CCAGACCCTG GAGGAAATCC TACCTTTGAA 
5001 TTCAAGAACA TTTGGGGAAT TTGGAAATCT CTTTGCCCCC AAACCCCCAT 
5051 TCTGTCCTAC C TTT AATC AG GTCCTGCTCA GCAGTGAGAG CAGATGAGGT 
5101 GAAAAGGCCA AG A GGTTTGG CTCCTGCCCA CTGATAGCCC CTCTCCCCGC 
5151 AGTGTTTGTG TGTCAAGTGG CAAAGCTGTT CTTCCTGGTG ACCCTGATTA 
5201 TATCCAGTAA CACATAGACT GTGCGCATAG GCCTGCTTTG TCTCCTCTAT 
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5251 CCTGGGCTTT TGTTTTGCTT TTTAGTTTTG CTTTTAGTTT TTCTGTCCCT 

53 01 TTTATTTAAC GCACCGACTA GACACACAAA GCAGTTGAAT TTTTA.TATAT 

53 51 ATATCTGTAT ATTGCACAAT TATAAACTCA TTTTGCTTGT GGCTCCXCAC 

54 01 ACACAAAAAA AGACCTGTTA AAATTATACC TGTTGCTTAA TTACAATATT 

54 51 TCTGATAACC ATAGCATAGG ACAAGGGAAA ATAAAAAAAG AAAAAAAAG A 

55 01 AAAAAAAACG ACAAATCTGT CTGCTGGTCA CTTCTTCTGT C C AAGC AG AT 

55 51 TCGTGGTCTT TTC CTCGCTT CTTTCAAGGG CTTTCCTGTG C C AGGTG AAG 

56 01 GAGGGTCGAG GCAGCACCCA GG TTTTGC AC TCTTG TTTCT CCCGTGCTTG 

56 51 TGAAAGAGGT CCCAAGGTTC TGGGTGGAGG AGCGCTCCCT TGACCTGCTG 

57 01 AAGTCCGGAA CGTAGTCGGC AC AGC CTGG T GGGCTTZCAG CTCTGGGAGC 
5751 TGGAGTCCAC TGGGGTGGCC TGACTCCCCC AGTCCCCTTC CCGTGACCTG 
5301 GTCAGGGTGA GCCCATGTGG AGTCAGCCTC GCAGGCCTCC CTGCCAGTAG 

58 51 GGTCCGAGTG TGTTTCATCC TTCCCACTCT GTCGAGCCTG GGGGGTGGAG 
5 901 CGGAGACGGG AGGGCZGGGG TG TCTCGGAA GGTGTGAGGT GCACC AG G T A 

59 51 GAACGCCAGG GACCCCAGAA TCATGTGCG? CAGTCCAAGG GGTCCCCTCC 
5001 AGGAGTAGTG AAGACTCCAG AAA TG TC CC T TTCTTCTCCC CCATCGTACG 
6051 AGTAATTGCA TTTGC TTTTG TA.ATTCTTAA TG AG C AA.TA.T CTGCTAGAGA 
6101 GTTTAGCTGT AACAGTTCTT TTTGATCATC TTTTTTTAAT AATTAGAAAC 
£151 ACCAAAAAAA- TCCAGAAACT TG TTC TTC C A. AAGCAGAGAG CA.TTATAATC 
62 01 ACCAGGGCCA A-AAGCTTCCC TCCCTGCTGT CATTC-CTTCT TCTGAGGCCT 

62 51 GAA.TCCAAAA. GAAAAACAGC CA.TAGGCCCT TTCAGTGGGC GGGCTACCCG 

63 01 TGAGCCCTTC GGAGGACCAG GGCTGGGGCA GGCTGTGGGG CCACA.TCCGG 
63 51 GGCCAGCTCC GGCGTGTGTT CAGTGTTAGC AGTGGGTCAT GATGCTCTTT 
6401 CCCACCCAGC CTGGGATAGG GGCAGAGGAG GCGAGGAGGC CGTTGCCGCT 
54 51 GATGTTTGGC CGTGAACAGG TGGGTGTCTG CGTGCGTCCA CGTGCGTGTT 
6501 TTCTGACTGA CATGAAATCG ACGCCCGAGT TAGCCTCACC CGGTGACCTC 
65 51 TAGCCCTGCC C GG ATGG AGC GGGGGCGACC CGGTTCAGTG TTTCTGGGGA 
6601 GCTGGACAGT GGAGTGCAAA AGGCTTGCAG AACTTGAAGC CTGCTCCTTC 
5651 CCTTGCTACC ACGGCCTCCT TTCCGTTTGA TTTGTCACTG CTTCAA.TCAA 
67 01 TAACAGC CGC TCCAGAGTCA GTAGTCAATG AATATATGAC CAAATATCAC 
67 51 CAGGACTGTT ACTCAATGTG TGCCGAGCCC TTGCCCATGC TGGGCTCCCG 
5801 TG TATCTGG A CACTGTAACG TGTGCTGTGT TTGCTCCCCT TCCCCTTCCT 
5851 TCTTTGCCCT TTACTTGTCT TTCTGGGGTT TTTCTGTTTG GGTTTGGTTT 
69 01 GGTTTTTATT TCTCCTTTTG TGTTCCAAAC ATGAGGTTCT C TC T AC TG G T 
6951 CCTCTTAACT GTGGTGTTGA GGCTTATATT TGTGTAATTT TTGGTGGG TG 
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7001 AAAGGAATTT TGCTAAGTAA ATC TCTTCTG TGTTTGAACT GAAGTCTGTA 

7 051 TTGTAACTAT GTTTAAAGTA ATTGTTCCAG AGACAAATAT TTCTAGACAC 

7101 TTTTTC TTT A CAAACAAAAG CATTCGGAGG GAGGGGGATG GTGACTGAGA 

7151 TGAGAGGGGA GAGCTGAACA GATGACCCCT GC C C AG ATC A GCCAGAAGCC 

7201 ACCCAAAGCA GTGGAGCCCA GGAGTCCCAC TCCAAGCCAG CAAGCCGAAT 

7251 AGCTGATGTG TTGCCACTTT CCAAGTCACT GCAAAACCAG GTTTTGTTCC 

73 01 GCCCAGTGGA TTCTTGTTTT GC TTCCCCTC CCCCCGAGAT TATTACCACC 

73 51 ATCCCGTGCT TTTAAGGAAA GGCAAGATTG ATGTTTCCTT GAGGGGAGCC 

7401 AGGAGGGGAT GTGTGTGTGG AGAGCTGAAG AGCTGGGGAG AATGGGGCTG 

7451 GGCCCACCCA AGCAGGAGGC TGGGACGCTC TGCTGTGGGC ACAGGTCAGG 

7 501 CTAATGTTGG CAGATGCAGC TCTTCCTGGA CAGGCCAGGT GGTGGGGATT 

75 51 CTCTCTCCAA GGTGTGCCCC GTGGGCATTA CTGTTT.-_-.GA CACTTCCGTC 

7 601 ACATCCCACC CCATCCTCCA GGGCTCAACA CTGTGACATC TCTATTC CCC 

7 551 ACCCTCCCCT TCCCAGGGCA ATAAAA.TGAC CATGGAGGGG GCTTGCACTC 

7 7 01 TCTTGGCTGT CACCCGATCG CCAGCAAAAC TTAGATGTGA GAAAACC CCT 

7 7 5 1 TCCCATTCCA TGGCGAAJ.AC ATCTCCTTAG AAAAGC C ATT AC C C TC ATT A 

7 3 01 GGCATGGTTT TGGGCTCCCA .^ACACCTGA CAGCCCCTCC CTCCTCTGAG 

7 851 AGGCGGAGAG TGGTG.-.CTGT AG TG AC C ATT GCATGC CGGG TGCAGCATCT 

79 01 GGAAGAGCTA GGCAGGGTGT CTGCCCCCTC CTGAGTTGAA GTCATGCTCC 

79 51 CCTGTGCCAG CCCAGAGGCC GAGAGCTATG GACAGCATTG CCAGTAACAC 

8001 AGGCCACCCT GTGCAGAAGG GAGCTGGCTC CAGCCTGGAA AC C TG TC TG A 

3051 GGTTGGGAGA GGTGCACTTG GGGCACAGGG AG AGGC CGGG ACACACTTAG 

8101 CTGGAGATGT CTCTAAAAGC CCTGTATCGT ATTCACCTTC AGTTTTTGTC- 

8151 TTTTGGC-ACA ATT AC TTT AG AAAATAAGTA GGTCGTTTTA AA_AACAJ_AAA 

62 01 TTATTGATTG CTTTTTTGTA GTGTTCAGAA AAAAGG TTC T TTGTGTATAG 

82 51 C C AAATG AC T GAAAGCACTG ATATATTTAA AAACAAAAGG CAATTTATTA 

53 01 AGGAAATTTG T AC C ATTTC A GTAAACCTGT CTGAATGTAC C TG TAT AC G T 

22 51 TTCAAAAACA CCCCCCCCCC ACTGAATCCC TGTAACCTAT TTATTATATA 

8401 AAGAGTTTGC C TTA.TA_-.ATT TA 
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Murine Sequenz des Nicht kodierenden RNA-Gens ( einschlieSlich pucativen 
Promotors ) 



1 


CTTAGAGTTT 


CGTGGCTTCG 


GGQTGGGACT 


AGTTGGAGCA 


TTGGGA.TGTT 


51 


TTTCTTACCG 


ACAAGCACAG 


TC AG G TTG.AA 


GACCTAACCA 


GGGCCAGAAG 


101 


TAGCTTTGCA 


CTTTTCTAAA 


CTAGGCTCCT 


TCAACAAGGC 


TTGCTGCAGA 


151 


TACTACTGAC 


CAGACAAGCT 


GTTGACCAGG 


CACTCCCCCC 


AACAATATCC 


201 


TCCCTCTTCC 


CCCCCCCCAC 


CCCCGCCCCG 


TGTGCTCGTT 


AGGGCAATTG 


251 


AAAGGACACT 


CCCATTTTTG 


GTGCCATTGA 


TGCCCTGTCC 


ATAATAGCTT 


301 


CCCTGACTTT 


TACACCACCC 


CAACTCCCAA 


TCTGAAGGAC 


TGGGAGGTGT 


■ 251 


GATGCAGGAG 


AAACTA.TGGG 


ACTCTTGGGA 


GAAGACTATG 


GAGTTGGCCA 


401 


GTGATTAAGG 


CCCACTAATT 


CCAA.CTGTGG 


TAGCACAGAT 


CTGGCTCCAC 


451 


ATC.AAC C C AA 


TCCAJLAACTG 


ACAAGGATAT 


TTTGCAAAAA 


AAGA.AAGTGG 


501 


CACCTGTCTG 


ATCCAGCTCT 


GACATGGCTA 


GAGGTGAGTC 


C T AAAC TG AT 


551 


GGCTTATAAA 


CTAGCCTGAG 


CCACAGAAGA 


GTATGGCCCA 


GAGTGAA.G TG 


501 


TCATCATCTG 


TTCACAAGGC 


ATGCTCCCCT 


AGAAGATAA.T 


GC TAAA.GAGG 


£51 


TGCCATGGAG 


GCAGCAGGAC 


AAAGTACAGG 


CAGGCTAGGT 


GGAGTCAAGC 


7C1 


CAGGCCTAGT 


GCCACAGAAC 


AAGAGAGCAG 


TC TG AC TAG T 


AATTAAGAGG 


~ =; ' 
i _j _ 
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861 


AGCTTAGAAT 


TATTTGCACT 


ATTGAGTCTT 


CATG . . CCCA 


CTTCAAAACA 


851 


AACAGATGCT 


CTGAAAGCAA 


AC TGGCTTG A 


AATGGTGACA 


CTGTCCCACA 


901 


AGCCACCAGA 


CATGGCAGTG 


TTCAGAACTA 


CCTGTATCTG 


TATATACCTG 


951 






C AG C AC AT AG 


GATTCCCAAG 


AAGCTCCGAA 


1001 


ACTCTAAGTG 


TTTGCTGCAA 


TTTTATAAGG 


ACTTCCTGAT 


TGCTTTC^CT 


1051 


CTCGTCCTTC 


CATTTCTTCC 


TTCCTTCCAT 


TTCATGCTTT 


CATTTCTTCC 


1101 


CCTAGCTTCT 


AGTTGTTTCT 


TCTGTTCCAG 


GCAGCTGCAG 


TGCTGAACCA 


1151 


CATGGTTACC 


TAACAGCAGT 


CAGCTGCAGC 


CCTAGGATTC 


TTCCTGCCCT 


1201 


TTAAC TTCCC 


ATTGCCAGTG 


CCAGGTATCA 


TA.TTTA_-.CCT 


TGAGCAAGAG 


1251 


CTGGGCTCTT 


TTGAGCCCTC 


CCTAACCTCT 


GTGAAGAAGA 


ACAAGAAGGT 


1201 


AGGAAGCTCT 


TGCTCTTGCT 


AAGAAAAATG 


TCAA-AAGGCT 


TTCAGACCTT 


1351 


AAACAATGAG 


CCTTTTCACC 


TTTTACTCTA. 


GAAAAGTGGA 


C T AG AAAATC 


1401 


TGGGTCACAT 


TGGGTAGCTG 


AAGGAGATAC 


AGAGGCCCCT 


ATGGCCTGCC 


1451 


AGAGTCGTTG 


CATGGCCCAA 


CAGGGGCTCC 


ATGCCCACTA 


CCCTTGACCC 


1501 


TACTCAGAAA 


TCTAATGTCA 


TACTTAGTGT GGGCAGGGGA 


CCTGTCAGGA 


1551 


CAGATGCAGA 


CCTAAGCAGG 


GAGTGACACC 


AGGGCCCTTG 


GCCCTTCTTC 


1601 


TGACAAACAT 


ACACATCCCA 


AG TC TTTTTC 


TAG TGG AATT 


CTTAACCTCT 


1551 


TGCTCACTGG 


GGACTGGGAA 


GCATCAGCAC 


ATCCCATATT 


TCAAACTCTG 
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1701 CTCCATAAGT ACAGTGGTGA ATTTTATAGA CTTGACTTTG CTGTGGGGTT 

17 51 TTAATTGGTC AGTTTTAATT TGGGATCCCA AAGTTTTAAC CTCCATTCAG 
1801 GAAGTCCTTA TCTAGCTGCA TATCTTCATC AT ATTGG TAT ATCCTTTTCT 

18 51 GTGTTTACAG AGATGTCTCA TATCTATCGA AATCTGTCTG AGAAGTACCT 
1901 TATC AAAG TA GCAAATGAGA CAGCAGTCTT ATGCTTCCAG AAACACCCAC 

19 51 AGGCACGTCC CATGTGAGCT GCTGCCATGA ACTGTCGAGT GTGTATTGTC 
2 001 TTGTGTATTT TCGTTAACGT TCCCCAGCTT CCTTCCTGCG GTGTAATCAT 
2 051 GGAAGAGTGA AACATCATAG AAATCGTCTA GCACTTCCTG GCCAGTCCTT 
2101 AGTGATCAGG AACCGTAGTT GACAGTTCCA ATTGATAGCT TAAGATAAAA 
2151 CCATGTTTGT CTCTTATGGA ATGGTTAGAA CTAAG TG AG A GATCTTGCCC 
2 2 01 CATTCTG TTT GCCGAATCAT AGTTGGACTT TTAGTGTATT TGTATCCATT 

22 51 TCCTTGTGCT ATAAAAGCAA ACCCTGCAAC CAGCT^CTG TCAGGCAGTC 

23 01 CTTTTGCCTG CTCTGCTTTT GATCCTCTTA GTCTTGCTTC TGGTTCCTCC 
22 51 CTGGAGAGGG AGG AGGGG TC AGAAGAGGAA TTCTGGAGGA TCC AGG AT AT 
2 4 01 GTCCTTCTGA ACTCCTGCTT CTTCCAGTGA CAAAAGGCCC CTACTGCCCC 

24 51 ACCCCAACCT GCCCCATGCA CTCCTCTAGG ACACCTTTCC ATACTTTTCA 
2501 CAACACCTAG CCAGGTTGAC ACCAAGTTGT TTATTGTGGT CTGCTTGGAA 

25 51 TTTTACCTGT TAGGCTTACT TAG TCC AATC AAATGGACTC CAAGTTGGGT 
2 5 01 ATCCCTCATC TTTGG.-_-.GAC AACCTAGGCT GATTAGATAT TTAC TTTTGG 
2 551 GATTGCAGCA CTTTGGGTGC CGTTTTTCTT TTACTTGGGT TTTATCTGCA 
2701 GCTCCCTCAC CACCACCACC ACCCCCCACT TACCTGTATG T AG AAC TG AT 

27 51 TTCAAAACTG CAGGTGGTGG TAACTGCAGC TTCTTAGGGT TTTCTTCACT 
2 8 01 TCTTGCT.TCT TTCCCCATTC CCTCATCCAC AAATAAGGGC ATCACAAGTC 

28 51 AGTCTCCTTT AAGCAGGCAG CTTTGGTGGG GTTTTTCCCC TGGAAGCCAG 

29 01 GGACCCTGTC AGGCTGCCTC TGCCTTGTGG TCAGGTTGAC AGGAGGTTGG 
29 51 AGGGAAAAGC CTTAAGTCAT GGGATTCTCA CCAGCTGTGT CTGGCTCAGA 
5 001 CCTGGAATGT G AC C TTT ATT TTGTTGTATT TGAACATTGT AAAG TGTGGG 
3051 TGGTACCTTA AACTGAATAT GTGAAGAATC CAGAAACTGA CCAACAGCTT 
3101 TCAGATACCT GGGGCTAGGT CACTAAGGTC ACATCCAGTC TTCCCTACCC 
3151 TGTTCTAGTT GTTAGCTACT ACCTCTCCCA GATAGATTGC TGTATATCCT 
3201 C C AACTATG A TCATCCTGGC CCAAGCTTGC CTC-TTCTTGA GTCTGTCTTA 
3251 ACCAGTGGAA CTGCTGCCCT TGGTGTGCAG TGAC-TTGAGG ACTCTTGGTC 
33 01 ACAGCCAGGC TCTAGTAGTA CAGCTCCTTT CTGCTGGTGC TG T ATTTCC A 
33 51 TATC AAAAGG CACAGGGGAG ATC TAG AAA.T GCCATCTCCC CCAGTCCATC 
3401 AGTGCCAAAC AAGCCCATGA TCCCAGCATG GG T AC AG ACA ACTCTGTTCA 
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3451 GTGCTATCAC AACAGACTAG AGGCCATGAA CATTGGACGT GGGAACCAGA 
3 501 GCAACCCGAA TTGCTGCTGC TTTATTCAGC TTTCCGTTGC TCTGACAATG 
3 5 51 ATAAAACAAG GCAGTAACTT AAAACAGACT GCCAGGTTTG GCAGAGAAAG 
3 501 GAAATTCCTT AG C TG A C AG C ACCTCTGGAT TTTAAATAGG TTG TA.A-TAAG 
3 6 51 TC-GCTCAAAC CCATCCAGGA AAAAGCAAAA GGGTTAGAAC TGACCAGATG 
3 7 01 AGACCAGCCT GATTTCATGC AGCCCAAATG GAGTCCAGCT GTCTGAACTC 
3 7 51 TGCAGCACTT CTCTACTACA GTCTCCTAGA GCATTCCAGC CAGGCTCTTC 
3 801 AGGCTGAGGA GACATCACAG GTGCCAGTTC TTCAAGAAGA CTT7TGTGCA 
3 851 TCAGTTCATA GCCTATATCT TTGCCCAAGA TTGTAGATTC AGGTTAACAC 
3 9 01 TACAC-ATTCT AGGGCAGATG ACTGAGACTC AGAAA-AAAAG CCCCTGTGGA 

3 951 CTGTGGTATA GCGAAGTACA AAAACTGAAG GGGGCZAGGG CAGATGCCGC 

4 0C1 ATGCCTCATG CCAGAGCCAA GCCCTCTGCT CCATCCACA? CCTTTTCTGG 
4051 CTCCTTCTTC CTGCTZTCTG C TTC AG TG AA CCAGCCGCAC TCTGAAGAGA 
4101 TTTGTTGATT CTCTCCATTT TTATGTCTTT CTCTTTTAGG TACTATATAG 
4151 AAAAGGCTTA GTCTAATTGT TAT AAA TTG C TAGAATACTG CZTCCCCCAG 
42 01 GGTCTAAAAA TATATGCTAA AGGGGAAAAC TTGAACACTG AAACCAGTTC 

42 51 TGAACAA.TTT AGAAGGAAAA CCTTGAAAAC ATTTAACAA-A AAATTATATT 

43 01 TTAATGTTTA TGAA.TAAGAG GAGGCTTTTG «_AAAA?G TT GATCTATAAA 

43 51 TACTTACTTT AGGCCTGAGG TGTCTAATGA GTGAAGTGAG CAATGGGAAC 

44 01 TCAAGGCTGA AGCCTCCTGC ATCAGAGGAG GTAGAACCAG GAGCCTCTTG 

44 51 AGATTTGAGG TGTTTTAGCA TTGGAAAGCC ACTCTTTGGG TAGCTGGCCC 

45 01 CAGAAACTAC TTCTGACCTT GTCATTTGGA ATGGAGGTTA C-TGGTCTGCC 

45 51 AGATGC C AAA GCTGCATGAG ACCAGCTCTT GGTTTATCAA TTTGAACACT 
4 501 C AG TAACCTA G AAGG C C C AG CACAAAGTGT CTGCTCTCTT C TT AAC TG AG 

46 51 CGTGCCCCAG CACTACTGCA CAAATTAGGG AGGGTCTACT TC C T AC AG AG 

47 01 CATCCCTCCC TGGGCGCCCT CCCATCCTTT GTACTCTACC TACCTGACCT 

47 51 TCAGGATCTT GGCACATACG AAATGGCTGT G TAG C AAG C A CTTTGGCATG 

48 01 CCCTCCTAAA CTTACCCCAG AGCCTCTCCC TC-CCTCCTTA AGCCAGTCTG 
4851 CCTGTCTTCT GGGGAGGTGT TAGAGCCCAT AGAATGGAGA GGAGAAAGAA 

49 01 AAGAGGAAGA GGCAGGCAGG TAGTAAAAAG GCTCTGGGAG GAAAGACAGC 
4951 CTCCTAGGCT TTGCACAAGC AGGACTCAGG CCCTTGTGGG AACTAAGTGC 
5001 CATCTTGGAG TTTAAGAACA TTTGGACAAG TTGCAAATGA CCTTTGCTCC 
5051 TTGCTCCTCT CACCTTTTAT GGGGCCCTGC TT AG C AC TG A AAGCAAATGC 
5101 GCTGAAAAGG C AAAG AGG TT TGGCTCCTGC CCACTC-ATAG TCCTTTCCCT 
5151 GCAGTG TTTG TGTGTCAAGT GGCAAAGCTG TTCTTCCTGG TGACTCTGAT 
5201 TAG ATC CAG T AACTTAAGAG ATTTGTATGC ATAGGTCTGC TTTGACTCTT 
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52 51 CTATTCTGGG CTTTTGATTT G TTTTTC AG T TTTGCTTTTA GTTTTCCTAT 

53 01 TTTTATTTTA TGCACCAACT AGACACACAA AGCAGTTGAA TTTATATATA 

53 51 TATATATATA TATATATCTG TATATTTCAC AATTATAAAC TCATTTTGCT 
5401 TGTGACGCCA CACACACACA AAAAGAAAAA CCTTTTAAAA TTATACCTGT 

54 51 TGCTTAATTA CAATATTTCT GATAACCATA GAGTAGGACA AGGGAAAAAA 
5 501 TTTAAAAAAA AAAAAAAAAA AAGAAAAAAC ACATCTGTCT GCTGG TC ACT 

55 51 TCTTCAATCC AAGCAGATCT GTGATCTTTC CTCGCGTCTT TCAAAGACTT 
5 601 CCCTGTGCTA AGTGAAGGAA GCTCCAGGCT GCACCCAGGT TTTGTGCTTT 
5551 GTTTCTCCTC TG TTG TG AAA GGGGCCCCAA GATTCTGGGT ACAGGACAGT 
57 01 TCATTTCAGC ATGGGGTCAG GAGACAAGAG CACTCCZTTT ACATGCTGAC 
57 51 GTACAGAACT TAGTGGGAAT AGCCTAGTCC CCACCTCTAG GGATGGGGAG 
5 301 CTAGCATGCA TGGGGGTGAC CCAACTCCCT CCACCTTTCC CTGGCCAGGA 
5 8 51 AGAGCCTGTG TACAGTAAGT CTGACAAGCT TTCCCCAGTT AG C AGG G C TC 
5 9 01 AGAGCATTTA AAAAC ZCTCC AAACTTTGCT GAGTCTAGGG AC TAG AG AG A 
5 9 51 AGATAGAAGA TTTGGTCTAT CTCCAAGGTG TGTAAGCTGT ACCAGGTAGA 
5001 ATGCCAGGGA CCCCAGAACC ACATCCAACA GCCCAATGGG TCTCCTCCAG 
5051 AAAGTAGTGA AGACTCCAGA AACATCCCTT TCTCTTCTCC CTGCTCCCAT 
5101 GAGTAACTGC ATTTGCTTTT G T AATC C TT A ATGAGCATTA TCTGCTAAAA 
5151 AAAAAAAATT AGCTGTAACA GTTCTTTTTG CAAAAGGATC ATTCTTAAAT 

62 01 AATTAAA-AAC ACCCCCCCCC CAAAAAAAAG TCCAGAACCT TGTTCTTCCA 
52 51 AAGCAGAGAG C ATT AT AA TC AGGGCCAAAA TCTGTCCCAC ACCTCTACCC 

63 01 CATCTCCTCA TGATTGCTGC TTCTAAGGCC AGAATACAGC AAAGATATTT 

63 51 GTAGGCCCTT TGGGTGAGTG GGCTACCCTT GGAGCTCTTG GAAGATGGGC 
6401 TGGGG AAGCC TCTGAG AC CC TATCC TAGGG CCTTGCTCTA GGGAGTAATC 

64 51 AG T ATT ACTA GAG TG TC AC A AC ATT ATTC C CCAGCCGGCA TGAGATGGGG 
5501 GCAGAAGAAG CC AAAGGG TT GTCTCCACTG CTACTTACTT GGCCACTGAC 

65 51 AGG T AGG TG A CCATGTATGT CCATATGCAT GTTTTATGGC TGATC-TGAGA 
6601 TCAGCACCCA AGTTAGCTTC ACCTGGTGAC CTCTAACCCT GCCTGGATGG 
6651 AGCAGGCCAC CTGGTTCAAT GTTTCTGGGC AGCTGGACAA TGGAGTGCAA 
6701 AAGGCTTACA GAACTTGAAG CCTTTTCCTT ACTTTGCTAG CACGGCCTCC 
67 51 TTTTCCATTT GATTTGTCAC TGCTTCAGTC AATAACAGCC GCTCCAGAGT 
6801 CAGTAGTTGA TGAATATATG ACCAAATATC ACCAGGACTG TT AC TC AAC G 
6851 TGTGCCGAGC CCTTTCCTTG TGCTGGGCTC CCTGTGTACC TGGACACTGT 
6901 AATGTGTGCT GTGTTTGCTC TCCTTCCTCT TCCTTCCTTG CCCTTTCCTT 
6951 GTCTTTCTGG GG TTTTTC TG TTGGGTTTGG TTTGGTTTTA TTTTTCCTTT 

Fig. 2 (Forts. 3) 
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7001 TGTGTTCCAA ACATGAGGTT TTCTCTACTG GTCCTCTTTA ACTGTGGTGT 
7051 TGAGGCTTCT ATTTGTGTAA TTTTTGGTGG GTGAAAGGAA CTTTGCTAAG 
7101 T AAA TC TC TT CTGTGTTTGA AATGAAGTCT GTATTGTAAC TATGTTTAAA 
7151 GTAATTGTTC CAGAGACAAA TGCTTCTAGG TACATTTTCA TTACAAACAA 
7201 AGCATTTGAA GGGAGGGAAG TGGTGAATAA GACAAGAGGG GCAATCTGAA 
7251 TTGATCCCTG CCCAGATCAG CCAGAAGCTA CCAAAAGTTA AGCACTGGTT 

73 01 TTCCATTCCA AGTCAAGAGA CTGAAGCTGA TGTTTTGCCA TTTTCAAAGT 
72 51 CAAAGCAAAA C C AG C TTTTC CACCCAATGG ATTCTTTGCT TCTCCTTCCC 
7401 AGATTATTAC TACTGCTGTA A.T.AATCTAGG AGTGCCAGGA GGGAAAGGAG 

74 51 TATTAACACA GAGCTGTGCT CACTGAGTAT GGAAAGGCTT GG TC TG AG TT 
7 501 TTCAGGAGGA TGACCCACTG TGGACATGGG GAGAAGACAG A_AGA.TAAA.TT 

75 51 AGCCGCTCCC TGCCTAAGAT ACCTCTTAAT AGATAAGTCA AGGCCATGGA 
7601 CATTATTGTC TACAAGGCAT GTTTCAA.AGA CATGACCAGT CAGGACACTT 
7651 CTGTCATACT CCATGTTGCC CCCTAGTACA CAGTACCAAT CTGATATCTC 
77 01 TGTTGCCGCC ATGCCTGGGG GA.TAA_AA.TG A. TAG C AG AG AC TCCTTTCC TT 
77 51 CAA.TGTGATC TAATTCCCAA CAAAATCTGG GCCTGAGATA CCACCTGTTT 
7S01 C TA.TGGC AAA CATCCTCAGT AAAGTGTTA.T TCTCA.TTGCA G.ATTG TTCC A. 
7851 GC CT AATGTA AGAGGAACAG AGCAGTGTTC CCTTGGAGCC TC A.TG TGG AC 
7 901 AG TT C T AC C T G TAG TG AC C A G TTGG C TATA G T AG TT ATT A. GCTGGAACAA 
75 51 CCAGACAGGG TACATGCCCC CTCCAAAATC CATGTTGTAC TCCCCTCTGC 
3001 CAGCCAGGGG GGGTC-AGATC TGTAGAATAG TGCAGC C AGT GACAAGCCAC 
3051 CTTGTGTTTG TCACCAGCTC A-AAAACTCAT CTAAGGTTGG GAGCAGGCAG 
8101 A.CAAGGCAGA GAGA_AA.GA.TC CAGGACAGAC CTAGCTGGGC TGGAGGGGTC 
8151 TTGAAAAGCC CTCTGTCGTA TTCACCTTCA GTTTTTGTGC TTTGGGACAA 
S201 TTACTTTAGA AAATAAGTAG GTCGTTTTAA AAA.CAA_AA.TA. TTGATTGCTT 
8251 TTTTG TAG TG TTCAAAACAA AAGGTTCTTT GTGTATAGCC AAATGACTGA 
83 01 AAGCACTGAT ATATTTAAAA. ACAAAAGGCA ATTTATTAAG GAAATTTGTA 
S3 51 CCATTTCAGT AAACCTGTCT G AA.TG T AC C T GTATACGTTT CA-AAAACACA 
8401 CCCCACTGAA CCCCTGTAAC CTATTTATTA TATAAAGAGT TTGCCTTATA 
8451 AATTTACATA AAAA 
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CT^AGAGTTTCGTGGCTTCAGGGTGGGAGT^ 

TTTTCTTAC CGACAAG CACAGTCAGGTTGAAG AC CT AAC CAGGGCCAG AA 
GTAGCTTTGCACTTTTCTAAACTAGGCTCCTTCAACAAG 

ATACTACTGACCAGACAAGCTGTTGACCAGGCACCTCCCC 

TC CAACAATATC 

TCCCGCCCAAACCTTTCCCCCATGTCGTCGTTAGAGACAGA 

CTCCCTCTTC C CC CCCG G C 



GCGACAGAGCAGTTGAGAGGACAC 
--G-«A A 



GTGCCATCAGTGCCC 
TGA 



CGTC. . 
T CATA-T 



-T TGA — . TTTA- 



GTTGGG ACAGGG AGGTG TG AGGCAGGAGAGAGAG TTGGATTCTTTAGAG A 
TGAA T T A--TA-G C GG 

AG. . - ATGGATATGACCAGTGGCTATGGCCTCTGCGATCCCACCCGTGGT 
--ACT- GT — G AT — A .CACTA — T A-T 

GGCTCAAGTCTGGCCCCACACCAGCCCCAATCCAAAACTGGCAAGGACGC 
A — A — GA T T — .A A TAT 

TTCACAGG A(^GG AAAG TGGCACtTTGTCTG CTC CAGCTCTGG CATGGCTA 
— TG--AA-A-A A A . 

GGAGGGGGGAGTCCCTTGAACTACTGG - GTGTAGACTGGCCTGAACCACA 
. . — A--T . . -A GA CT-A — A A G 

GGAGAGGATGGCCCAGGGTGAGGTGGCATGGTCCATTCTCAAGGGACG . T 
-A T A A T CA--TG A C-T-C- 

CCTCCAACGGGTGGCGCTAGAG .... GCCATGGAGGCAGTAGGACAAGGT 
— C-T-GAA-A-AAT A--AGGT C A— 

G CAGG CAGGCTGG CCTGGGGTCAGGCCGGGCAG AGC A CAGCGGGGTGAGA 
A A-.G A A A CT--TG-CA-A-AACA--. 



GGGATTCCTAATCACTCAGAGCAGTCTGTGACTTAGTGGACAGGGGAGGG 
ACTAG — A- 

GGCAAAGGGGGAGGAGAAGAAAATGTTCTTCCAGTTACTTTCCAA 

. . .T A A— A-G A A G 

CTTTAGGGACAGCTTAGAATTATTTGCACTATTGAGTCTTCATGTTCCCA 



CTTCAAAACAAACAGATGCTCTGAGAGCAAACTGGCTTGAATT^ 
A A 

TTTAGTCCCTCAAGCCACCAGATGTGACAGTGTTGAGAACTACCTGG^ 
C- . . A CA — G C T--C 

TGTATATATACCTGCGCTTGTTTTAAAGTGGGCTCAGCACATAGGGTTCC 
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--A 
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. . GT-T-A-A . . -A— T C-A-AGC TT C 

CCAACCTGGCCTGTCTG . TGAAGAGCAAGAGAGCAGCAAGGTCTTGCTCT 
--TC AA C-G--AA A AG-T--G C 

CCTAGGTAGCCCCCTCTTCCCTGGTAAGAAAAA . . GCAAAAGGCATTTCC 
— C TGT . A 

CACCCTGAACAACGAGCCTTTTCACCCTTCTACTCTAGAGAAGT 

G T-A T . T A A 
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— AA-T T-AC G C A-G -GAT . A- 

GGCCTGCC. . AGTCATCGAGTGGC CCAACAGGGGCTC CATG CCAG CCGAC 
AG G-T-CA CA-TAC- 

CTTGACCTCACTCAGAAGTCCAGAGTCTAGCGTAGTGC^ 

CT A — T-AT ATA-T T . . 

GCt^TACCAATGCAGAACTCCCAAGACC£GAGCTX?GGACCAGTACCTGGG 
. . — G TG-CAG—CAGATGC TA A CTGAC A 

TCCCCAGCCCTTC CTCTGCTCCC CCTTITCC CTCGGAG TTCTTCTTGAAT 
C — TTC T ACAAA - A - ACA - ATC - CA CT — T-CT-G- 

GGCAATGTTTTGCTTTTGCTCGATCCAGACAGG . . . GGGCCAGAACACCA 
— A-T-C--AAC — C AC — GG T — GAA-CAT C T-C 

CACATTTCAC TG TC TG TXTTGGTCCATAGCTGTGGTGT AGGGGCTTAGAGG 
— T . . . .AAC C AG -ACA GT-AATT T — A 

CATGGGCTTGCTGTGGG l'l'l"lTAATTGATCAGT > i M l"l'CATGTC^GATCCCA 
-T— ACT G G A— T 
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1781 AAG CA _ 



1899 ATATTGGTATAT 
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G TG TTT ACAGAG ATGTCTCTT A . . TATCTA 



1947 AATCTGTCCAACTGAGAAGTACCTTATCAAAGTAGC^ 
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. ATGAACTCTCAAGTGTGTGTTGTtTTTCTGTATTTC . TCCCTG 
G A TC AC-T CA 

GCTTCCTTACTATGGTGTAATCATGAAGGAGTGAAACATCATAGAAACTG 
c — GC G-A TC- 

TCTAGCACTTTCCTTGCCAGTCTTTAGTGAT 

G C G 

TC CAATCA.CT AGCTT AAGAAAAAACCGTG TTTGTC^ 

TGA A A A 

AG ... . AAGTGAGGGAGTTTGCCCCGTTCTGTTTGTAGAGTCrrCATAG^ 
--AACT A--TC A CC--. .A 

GGA CT ' l M rC TAGCATATATGTGTCCATTTCCTTATGCTGTAAAAGCAAGTC 
. TG T A G A AC- 

CTGCAACCAAACTCCCATCAGCCCAATCCCTGATC 

GCT-T-TG G- -GT TTG- 

CTGCTCTGCTGATGACCCCCCCAGCTTCACTTCTGACTC^ 
TT T — T-TT — TC-TG GT — C TG-AG- 

GGGAAGGGGGGTCAGAAGAG AGGGTGAGTCCTCC 

G-A GAATTCTGGAGGATCC A - AT T- 

AGAACT CTTCCTCCAAGGACAGAAGGCTCCTGCCCCCATAGTGGCC 

T CCTG T GT A C A-TG — CC- .... — 

TCGAACT . . . CCTGGCACTACCAAAGGACACTTATCCA . CGAGAGCGCAG 
C-A-C--GCC— AT C-TCT C-T TACTTTT-A — A 

CATCCGACCAGGTTtSTCACTGAGAAGATCTTTATTTTGGTCAG . TTGGGT 
— C-TAG A . . .C T G T-C AA 

TTTTATGTATTA. . . . TACTTAGTCAAATGTAATGTGGCTTCTGGAATCA 
CC-G GGCT C CA 

ATCTGGTCCTGGTAAG 
- -T-G 



. -AC AA — TGGG - ATCCC- 



AGGAGTGCGTGGCCCACCAGX^CCCCCTGTCACCCATGACAGTTCATTCA 
- —AC-T 

GGGCCGATGGGGCAGTCGTGGTTGGGAACACAGCATTTCAAGCGTC . ACT 
A T TA-AT-T-TACTT TTG C--TGG-T-C-GTT- 

TTATTT<^TTXXX*^CCG*CCrGCAG 

— C T-C-T TTTT-T . . -CCAC— CCAC-A-C 

. TCCAGTTTATTCCAGAGCTGC CAGTGGGG . . . C 
-GTATG - AG - AC -G T— A-A AG T-GTAA 



CTGAGGCTCCTTAGGGT 
CA T 



TATTTCCCCCTTTCTTCCTCATTCC 
-TC-C TTG CT C 



TCATG — 



, .GGCATCACGAGTCAGTCGCCTTTCAGCAGGC 
A--. . .-A TAAG A T A 

AGCCTTGG . CGGTTTATCGCCCTGGCAGGCAGGGGCCCTGCAGCTCTCAT 
T TG — G — T-TC A — C A G 

GCTGCCCCTGCCTTGGGX7TCAGGTTGACAGGAGGTTC . AAAGCCT 
T T A 

AGTTTTGGGGTCTGA 
-T— -ACC AA-G 

TACTTG AACATTATGAA . . GATGGGGGCC 
. - -T G.A. . GT.TG . ,T. - TA 

3196 TCTTTCAGTGAATTTGTGAACA . . GCAG . AATTGACCGACAGCTTTCCAG 
3056 C AA-C A G-ATC A— C A AGA 

3243 TACCCATGGGGCTAGGTCATTAAGGCCACATCCACAGTCTCCCCCACCCT 
3106 C T T---T . 

3293 TGTTCCAGTTGTTAGTTACTACCTCCTCTCC^ 

3151 T C TC-CAGAT-G-T-G A — C- 

3343 CGAGCTCCCCCCAGGTCTAC^CTCCCGGCCCTGCCTGC^ 

3201 -C-A— AT -A — AT — TGG AAG-T T-CT — A-TC-- 

3393 TCATAG CCAGTGGGATTGCCGG 1XJ1TGACACCTCAGTGAGCTGGAGAT AC 
3246 — T— A A-C T-CC .GT-TG T — AG — CT- 

3443 TTGGTCACAGCCAGGCGC . . . TAGCACAGCTCCCTTCTGTTGATGCTGTA 
3295 T-TAG T T C~G 

3490 TTCCCATATCAAAAGGCACAGGGGACACCCAGAAACGC^ 

3345 — T G-T-T T TC G 

3540 TCCATCAGTGCCAAACTAGCCAACGGCCCCAGCTTCTC 

3395 A C-T-AT A- 

3590 GGCCGAAGCTCCTACTCGT^AGCGCCAGTGCGGGTGCAGAC^ 

3430 A ..C 

3640 TTGGGTGGCATCATTCCAGGCCCGAAG - CATGAACAGTGCACCTGGGACA 
3447 — CA CT CAA A-TA — G-C T — G — G AC 
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3 689 GGGAGCAGCCCCAAATTGTCACCTGCTTCTCTGCCCAGCTTTTCATTGCT . 
3497 CA A G — T- G G — T-ATT C-G 

3739 GTGACAGTGATGGCGAAAGAGGGTAATAACCAGACACAAACTGCCAAGTT 
3542 C A . .A C-A--C-G TTA-A G G 

3789 GGGTGGAGAAAGGAGTTTCTTTAGCTGACAGAATCT^ 

3589 T— CA AA C C-C G A 

3839 ACT . . TAGTAAGCGGCTCAAGC CCAGGAGGGAGCAGAGGGATACG A 

3639 CG-TG — A T A-CCAT AAA A-A — G-TA — 

3883 G CGGAGTC C CCTGCGCGGGACCATCTGGAATTGG TTTAGCCCAAGTGG AG 
3689 A-T-- -CAGAT-A G-CT--T— CA-GC A 
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GAGCATTCCAGTCAGGCTCTCTGGGCTGACTGG-GCCAGGGGAGGTTACAG 
C TCA A — CA-C 

GTACCAGTTCTTTAAGAAGATCTTTGGGCATATACATTTTTAGCCTGTGT 
— G C CT T-- . . — CAG--CA A-A- 

CATTGCCCCAAATGGATTCCTGTTTCAAGTTCACAC 

-T A- .... GTA-A G A . — A 

ACCTGTGTCCTAGACT TCAGGGAGTCAGCTGTTTCTAG 

G-AGA — A-TG CAGAAAAAAAGCC-CT-TG-A-T-TG — A-AGC- 

AGTTCCTACCATGGAGTGGGTCTGGAGGA CCTGCCCGGTGGGG 

-AG-A-A-AA-CT — AG G — A-G-C-GATGCCG-A TCA — CCA 

GGGCAGAGCC . . CTGCTCCCTCC GGGTCTTCCTACTCT 

-A — CA CT A ACATCCTTTTCT — C — C-T — T- . — 

TCTCTCTG CTCTCACGGGATTTG1TGATTCT 

G CTTCAGTGAACCAGCCCCA A-A 

CTCCATTTTGGTGTIWIVI^ITTTAGATAT^^ 

XA G--C-A-- 

GGCATAGTCTACTTGTTATAAATCGTTAGGATACTGCCTCCCCCAGGGTC 
T A T-C A 

TAAAATTACATATTAGAGGGGAAAAGCTGAACACTGAAGTCAGTTCTCAA 
A — T — GC — A CT AC G — 

CAATTTAGAAGGAAAACCTAGAAAACATTTGGCAGAAAATTACAT^ 
T AA--A T TAA 

TGTTTTTGAATGAATACAAGCAAGCTTTTACAACAGTG^ 

AG--G-G GA — A-A— T T 

T ACTTAGCACTTGGCCTGAGATG C CTGGTGAGCATTACAGGCAAGGGGAA 
. -TT-A G— T— AA TGAACTGA T 

TCTGGAGGTAGCCGACC 

GAGATTTGAGGTGTTTTAGCATTGGAAAGCCAC TTG T-G — 

TGAGGACATGGCTTCTGAACCTGTCTTTTGG GAGTGGTATG 

CC- . — A-CTA C-T A AATGGAGGTT 

GAAGGTG GAGCG 

CC— A — CCAAAGCTGCATGAGACCAGCTCTTGGTTTATCAATTT- -A-A 

TTCACCAGTGACCTGGAAGGCCCAGCACCACCCTCCTTCCCACTCTTCTC 
C- . . . A A A-AGTGT- -G- 

ATCTTGACAGAGCCTGCCCCAGCGCTGACGTGTCAGGAAAACACCCAGGG 
T A- -T A — — TGCACA 

AACTAGGAAGGCACTTCTGCCTGAGGGGCAGCCTGCCTT . . GCCCACTCC 
— T G CT— A— T ACA-A T — CT — C-GG C 

TGCTCTGCTCGCCT CGGA 

CATCCTTTG-A A-CTA GACCTTCAGGATCTTGGCACATA — A - 

TCAGCTGAG CCTTCTGAGCT GG 

ATG T-TAGCAAGCACTTTGGCATGC C — A-A — TACCCCAGA- 

CCTCTCACTGCCTCCCCAAGGCCCCCTGCCTGCCCT 

C TT C-AGT T-T-CTGGGGAGGTGTTA 

GTCAGGAGGCAGAAGGAAGCAGGTG 

GAGC C CATAG AATGGAG AGGAG AAA - AA - A A G-C-G A 

TGAGGGCAGTG>CAAGGAGGGAGCACAACCCCCAGCT > CCCGCTCCGGGCTC 
GT-AAAAG-CT-TG A -AG G — T--TAGG- 

CGACTTGTGCACAGGCAGAGCCCAGACCCTGGAGG AAATCCTACC 

-T A GA-T C T-T — GAACT — G-G-C-T- 

TTTGAATTCAAGAACATTTGGGGAATTTGGAAATCT C TTT G CCCCCAAAC 
— G — G— T AC — G C GA-C — TG-T— TTG- 

CCCCATTCTGTCCTACCrrTAATCAG 

T — — TC T — GG — C T C A h~ 

TGAGGTGAAAAGGCCAAGAGGTTTGGCTCCTG^ 

— C-C A .T T- 



CCCCGCAG 
— T- 



AGTGGCAAAGCTGTTCrTCCTGGTGACCC 
T- 



TGATTATATCCAGTAACACAT AGA . . . CTGTGCGCATAGGCCTGCTTTGT 
G TT- . GATT AT T A 



TAGTTTTGCTTTTAGTTTT 



CTCCTCTATCC 

T T A T C 

TCTGTCCCTTTTATTTAACGCACCGACTA 

C--A- . . . T-T A 



S342 
5343 

5380 
5393 

5426 
5443 

5476 
5493 

5525 
5543 

5575 
5592 

5625 
5642 

5675 
5690 

5692 
5740 

5742 
5786 

5785 
5833 

5835 
5878 

5881 
5928 

5930 
5978 

5980 
6028 

6029 
6078 

6077 
6128 

6122 
6178 

6158 
6228 

6208 
6275 

6244 
6325 

6294 
6373 

6344 
6421 

6392 
6471 

6442 
6521 

6488 
6571 

6538 
6621 

6588 
6669 

6638 
6719 

6687 
6769 

6737 
6819 

6786 
6869 

6835 
6919 

6885 
6969 

6935 
7017 

6984 
7067 

7034 
7117 

7084 
7167 



TTTATATATATATCTCTATATTGCACAATTATAAACTC 

TATATATATATATA T 

ATTTTGCTTGTGGCTCCACACACACAAAAAAAG ACCTGTTAAAATT 

A-G C AAAA T 

ATACCTGTTGCTTAATTACAATATTTCTGATAACCATAGC^ 

GGAAAATA . AAAAAAGJIAAAAAAAGAAAAAAAAACGACAAATCTGTCTGC 
A-TTT A A G AA C 



TGGTCACTTCTTCTGTCCAAGCAGAT 
AA CT- 



GCTTCTTT 



CAAGGGCTTTC CTGTGCCAGGTGAAGGAGG CTCCAGGCAGCACCCAGGTT 
A-A C T-A A T 



CCGTGCTTGTGAAAGAGGTCCCAAGGTTCTGGG 
-TC — . G— C A 



TGCAG GAGCGCTCCCTT 

-A GACAGTTCATTTCAGCATGGGGTCAGGAGACAA A 

GACCTGCTGAAGTCCGGAACGTAGTCGGCACAGCCTGGTCGCCTTC 
T — A C — A-A T G — A-T A . . . .C 

TCT GGGAGCTGGAGTCCACTGGGGTGGCCTGACTCCCCCAGTC 

AGGGATG A-CA-G — TG A— CA T- . . . - 

CCCTTCCCGTGACCTGGT'CAGGGTCAGCCCATGTGGA 
A T- C AA TG AC— A— T — GA— A 

GCCT . . CCCTGCCAGTAGGG . TCCGAGTGTGTTTCATCCTTCC . CACTCT 
--T-TC A-TT — C C — A CA-T-AAA-A— C AA T- 

GTCGAGCCTGGGGGCTTGGAGCtK^GACGGGAGGCCTGGCCTGTCTCGGA . 
-CT T — A A — A A-A TA-A— ATT T — A CA-G 

ACCTGTGAGCl^CACCAGGTAGAACGCCAGGGACCCCAGAATCATGTGCG 
GTG A T T C- -CA-C -A 

TCAGTCCAAGGGGTCCCCTCCAG . GAGTAGTGAAGACTCCAGAAATGTCC 
A C T T AA CA 

CTT . . TCTTCTCCCCCATCCTACGAGTAATTGCATTTGCTTTTGTAATTC 
TC TGC C-T C C- 

TTAATGAGCAATATCTGCT AGAGAGTTTAGCTGTAACAGTTCTTT 

T AAAAA-A-A-AA 

TTG ATCATCTTTTTTTAATAATTAGAAACACC AAAA 

CAAA-GG A — C — A A CCCCCCCCAA 

AAATCCAGAAACI^rGTTCTTCCAAAGCAGA 



CCAAAAGCT . TCCCTCCCTGCT GTCATTGCTTCTTCT 

T — G A-A-CT — ACCCCATCTCCTCA-G G 

GAGGCCTG AATC CAAAAGAAAAACAGCCATAGGCCCTTTCAGTGGCCGGG 
A A . . -C-GC G-T-TTTG GG A-T 

CTACCCXSTGAGCCCTTCGGAGGACCAGGGCTGGGGCA^ 
T — GAG-TC-T A — . . T A A-A — C 

CATCC . . GGGGCCAGCTCCGGCGTGTGTTCAGTGTTAGCAGTGGGTCATG 
T TA C-TT TA-G-A — AA A T — A-T CA 

ATGCTCTTTCCCACCCAGCCTGCGATAGGGGCAGAGGAGGCGAGGAGGCC 
-CAT- A— C G — G — A — A G A— A— C-AAG— TT 

G TT G CCGCTG AT G TTT GG CC G T G AACAGGTGGGTGTCTGCGTG-CGT 

— CT— A CTACT-AC ACTG A A-CAT — AT — 

CC^CGTGCGTGTTTTCTGACT<»CATGAAATCGACG 
TA A A--G TG G - - - AG- A — -A — T— 

ACCCGGTGACCTCTAG^CCTGCCCGGATGGAGCGGGGCCCACCCGGTTCA 
T A T A — . . T 

GTGTTTCTGGGGAGCTGGACAGTGGAGTGCAAAAGGCTTC 
A C A A 

. TTTCCGTTTGATTTGTC 
T A 

ACTC^TTCAATCAATAACArcCGCTCCAGAGTCAGTAGTCAATGAATATA 



TGACCAAATATCAC CAGGACTGTTACrTCAATGTGTGCCGAGCCCTTGCC . 
C — -T— T 

CATGCTGGGCTCCC . GTGTATCTGGACACTGTA 



TG- 



TACTTGTCTTTCTGGGGTTTTTC 



TGTTTGGGTTTGGTTT^TTTTTATTrc 

GGTTCTCTCTACTGGTCCTC . TTAACTGTGGTGTTGAGGCITATATTTGT 
GTAATTTTTGGTGGGTGAAAGGAATTTTGCTAAGTAAAIVI^ I'TC TGTGT 
TTGAACTGAAGTCrrGTATTGTAACTATGTTTAAAGTAATTC 
CAAATATTTCTAGACACTTTTTCITTACAA^ 

GC GT--A A . T-A 



Fig. 3 (2) 
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7134 GGGGATGGTGACTGAGATGAGAGGGGAGAGCTGAACAGATGACCCCTGCC 
7216 --AAG A-A CA CA-T . . .T T 

7184 CAGATCAGCCAGAAGCCACCCAAAGCAGTGGAGCCCAGGAGTCCCACTCC 
7263 T A — . . . TA A-T — TT-T T 

7234 AAGCCAGCAArcCGAATAGCTGATGTGTTGCCACT^ 

7310 T--AG-GA-T — . . T T A AA 

7284 AAACCAGGTTTTGTTCCGCCCAGTGGATTCT 

7358 C-- . . . A A T T 

7334 CCGAGATTATTACCACCATCCC G TGCTTTTAAGGAAAGGCAAGATTGATG 
7401 ... T-- G-A- 

7384 TTTCCTTGAGGXX^GCCAGGAGGGGATGTGTGTGTGCAGAGCTGAAGAGC 
7422 . . -AA-CT-— A-T A-A- . -A — A-TA-C- C 

7434 TGGG GAGAATGG . . . GGCTGGGCC CACC CAAGCAGGAGGCTGGG 

7465 — T-CTCACT T AAA T — T-TGAGTTTT A— AC 

7475 ACGCTCT . G CTGTGGGCA CAGGTCAG . . GCTAATGT TGGC 

7515 C-A — G-G-ACA G-G-A-A AA-A AT-AGCCGCTCCC— C- 

7512 AGATGCAGCTCTTCCTGGA . CAGGCCAGGTGGTGGGCATT . CTCTCTCCA 
7565 TA-GAT-C : -AA~A — TA — T-A CCA A AT-G A — 

7560 AGGTGTGCCCCGTGGGCATTACTGTTTAAGACACTTCCGTCACATCCCAC 
7615 CA— TTT-AAA-A G — CAG-C-G T T-CT T 

7610 CCCATCCTCCAGGGCTCAACAC . . . TCTGACATCTCTATTCCCCACCCTC 
7665 GTTGC--C-T— TA-A — GT — TAA-C T G - 

7657 CCCTTCCCAGGGCAATAAAATX^CCATG^GGG 

7708 G— A-G — T GG TAGCA ACTC T- CA 

7707 CTGTCACCCGATCGCCAGCAAAACTTAGATGTGAGAAAACCCCTTCCCAT 
7753 A G-T-TA — TC A TC-G-GCC T-C-A . . . GT- 

7757 TCCATGGCGAAAACATCTCCTTAGAAAAGCCATTACCCTCATTAGGCATG 
7800 — T A— C- C — T . TG TT GCAG — T 

'7807 GTTTTGGGCT CCCAAAACACCTGACAGCCCCTCCCTCCTCTG 

7845 — CCA-C— AATGTAAGAGG— C-G-G-A-TGTT T-GGAG . . 

7849 AGAGGCGGAGAGTGCTGACTGTAGTGACCA . TTGCATGCCGGGTGCAGCA 
7893 . . -T-T C T — AC G GC - ATA-TAGTT - TT - 

7898 TCTGGAAGAGCTAGGCAGGGTGTC^TGCCCCCTCCTGAGTTGAAGTCATGC 
7941 G C-A-C--A : ACA AA-A-CC-T — TG-A- 

7948 TCCCCTGTGCCAGCCCAGAGGCCGAGAGCTATGGACAGCATT . . . GCCAG 
7991 C . G--GG-T A-C— T-G-AT-G-GCA 

7995 TAACACAGGCCACCCTGTGCAGAAGX^AGCTGCCTCCAGCCTGGAAACCT 
8040 - . . G A T TT — T-A TCAA TC 

8045 GTCTGAGGTTGGGAGAGGTGCACTTGGGGC!ACAGGGAGAG . GCCGGGACA 
8079 A— A CA- . GACAA G--A— A—AT— A 

8094 CACTTA GCTGGAGATGTCTCTAAAAGCC CTCTATCGT ATTCAC CT 

8128 G — C — GCTGG GG TG C-G 

8139 TCAGl Tri "ri Vl X g l" iT TGXKSACAATTAC^ 

8178 C 

8189 TAAAAACAAAAATTATTGATTGCTTTTTTGTAGTGTTCAGAA . AAAAGGT 
8228 . A— C 

8238 TCTTTGTGTATAGCCAAATGACTGAAAGCACTGATATATTTAAAAACAAA 
8276 

8288 AGGCAATTTATTAAGGAAATTTGTACCATTTCAGTAA^ 

8326 

8338 TACCTCTATACGTTTCAAAAACACCCCCCCCCCACTCAATCCCTGTAACC 
,8376 -A C 

8388 TATTTATTATATAAAGAGTTTGCCTTATAAATTTA 
fid22 



Fig. 3 (3) 

gestrichelte Linie: Putativer Promotor 

durchgezogene Linie: sequenzkonservierte Sequenz mit hoher 
Energie 



14/21 



0 2.000 4.000 6,000 8,000 

1 I I I I I I I I I I I I I I I I I I I I I I 




0 900 1800 2700 3600 4500 5400 0300 7200 8100 9000 , / 

position 



Fig. 4 



schwarz similarity 1 00 window 
blauhinlexlO humaa^ 



human 

schim 

orang 

makak 

hams t 

mouse 

rat 

kaeng 

human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 
schim 
orang 
"Si- akak 

mouse 

rat 

kanga 

human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 

human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



TTGCTGCAGATACTACTGACCAGA* 
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CKTTGTTGACCAGGCACCrcCCCrc 



. - AATA . . ,-TC. , 



CCCCCATGTGGTCGT 



-T-T- 



A C--A- 

- -CAA- AATATCCT -CC -CTTCCCCCCCCCCACCCCCG .G c 

-ACAA-AA-A-CC— C-CCCTCCTCACCCCACCCCTAT TG C— A- 

-TTT-TAGGGTA-A — AGC GC — T TCATC-C- 



-TC- 
-TC- 



101 

TAGAGACAGAGCGACAGAGCAGTTGAGAGGACACTCCCGTTTTCGGTGCCATCAGTGC 



.T— 
. - G- 
.-G- 



GCTCCCCCAGCTCCCCCC 



-A A A T TGA T C-T- 

-A A T CTGA T C-T- 



--T TGA TT--. 

ATA T TGA--TTTA- . 

. . . T TGA--TTTA- . 



ACCTCCCCC 



A- 

A- 

-A- 



-A 
-A 
--A 



-AGGGA-GGT — AC-G-T — T — CT — A- A — TAA - AG AGT AG - G - TAGTGG - AG - TTA - ATTTT -AGTG-- 



201 

ACTCCCAACCACGTT 



-T-TGA. 
-T-TGA. 
-T-TGA. 



GGGACAGGGAGGTGTGAGGCAGGAGAGACAGTT . 



A— 



- C C A-A-T-T-G. 

-T T A — TA-G - 

-T-- 



. GGATTCTTT AGAGAAG A . . . TGGATATGACCAGTGGCTATGGCCTGTGC 
. . . T 

C . . . C 

G c 

CTA . . — GG A--G CA.-T 

. C GG CTA GT — G AT — A CA. CT 

C A — TA-ATA C GG CTA -A — GT--G-A AT-GC-C — CA. -T 

-T-AA — TT-TA — CCAA-GTCTTA-AT-A-T-T-TT-AG-G-TTTT — CCCT GG-GCC.G — GGG — GGGG-A — G- . — ATT A- . . . 

301 

GATCCCACCCGTGGTGGCTCAAGTCTGGCCCCAGACCAGCCCCA^ 

C 

C A C . T 



human 
r _schim 
parang 
-iiakak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



A — TAG-A-T- 



-T-CA- 



-AT- 



A — T A-T A — A — GA T T — A . A-- 

A — T A-T A — A T A . A-- 

AT TTAGGAAA- A- -G-TG — A-A-A- AG- -G-G — CTGAGC-GTTGGC A. . - 



TAT — TGA-AA CA-T A- 

TAT — TG — AA-A-A A- 

AT — TG- -AA-A-T TT A- 

- - - G A - C - TGACT AGGG - CC - G T- .A AA- 



401 

AGCrcrGGCATGGCTAGGAGGGGGGAGTCCCTTGAACrACTGGGT . OTAGACTGGCCTGAACCACAGGAGAGX3ATGGCCCAGGGTGAGGTGGCATGX3TCC 
n 

A-TC ! 

A-TT- 

T— A-G T-A-T. . 

A AG-T-A-T. . 

AGAT-A-T. . 

CAAGG CCA — T-A-T - . 



. A--T 

. __ . G A-TAC T G A T-- 

. — . -A GA C-TA— A A G A T- 

. -T. -A GT C-TA — A G-A A 

. . A — AGGG -GGG — AAGAC-T-A-A-AAGGA-TAG . .AA-C 



A A— A-A--AT CAC-T 

A A T CA--T 

A--A-A T CA— T 

-A— T CC-A-A-AA-AGC T . 



501 

ATTCTCAAGGGACG . TCCTCCAACGGGTGGCGCTAGA , GGGCATGGAGGCAGTAGGACAAGGTGCAGGCAGGCT 

c C 

m _ c c 

, GTT A GA. . . CA CA C- 

GC--A C-T-C-T-A-T-GA-AA-AATT A-GAGG.T C CA — A T GTG A A-A-CT 

G A C-T-C C-T-GAA-A-AAT A-GAGG.T C A — A A-GTG-A-. A A CT 

G A C-T-C C-T-GAA-T-CAT A-GAAG . T C A — A -A-GTG-A- . A A CT 

--AACC-TAC--A GGA-T — A-TTG-A-GAGGCCC-T A-TCCCC-ACCACCAA-A . . . .AT-T — A-C-GCA--T. . — TT 

601 

AGCACAGCGGGGTG AGAGGGATTC CT AATCACT CAGAGCAGTCTGTGACT TAGTGGACAGGGGAGGGGGCAAAGGGGGAGGAGAAG 



-C 



G G GGTAGTTAGGGACTC . -G-G 

-A CGT- . . CGGTAGTTAGGGACT A . 

— TG-CA-A-AACA A-CAAT — G . TG . . . --T TA-G -T TG--AC-A .GC-T A — A-T- 

— TG-CA-A-AACA A-CAGT-- . . .G . . . --T-A-TAAGA A — A-G- 

--TG-CA-A-A-CA A-CAGT--C.TG . . .--T TAAG- A--A-GA 

CATTT - -T — ACCTT - T - TATA- - TGGGTGTG - ATGCAC -TAGATA A -TGA — A-GA 

701 



AAAATGTTCTTCCAGTTACTTTCCAATTCT . . . CCTTTAGGGACAGCTTAGAATTATTTGCACTATTGAGTCTTCAT 



A A G ... 

A A— G G . . . 

C CT G-G— ACTAGC- 



GTTCCCACTTCAAAACAAA 



801 

CAGATGC 



G C-G-C A T — GA TCCCA 

TCTGAGAGCAAACTCGCTTGAATTGGTG^ TGACAGTGTTGAGAACTACCTGGATTT 



-T--CTGAGATG-TCA-C- 
901 

GTATATATACCTG 



G G 

A A C- . . A CA 

A A C- . . A CAA 
























-GCCC - TG -CACTTA- TTA CACTGGTG TG-G TT C AT 



Fig. 5 



-CCTG. 



— CCTG. 

— GG CTG. 
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Teilsequenz des Nicht kodierenden RNA-Gens aus dem Hamster 

1 TTGCTGCAGA TACTACTGAC CAGACAAGCT GTTGACCAGG CACCCCCCCA 

51 ATACTCCCCC AATGTGCTCA TTAGAGATAG CAGTTGAGAG GACACTCCCA 

101 TTTTTGGTGC CCTGTCCATA GCTTCCCTGA CTCTTCCACC ACCCCAACTC 

151 CCAATCTGAG GGACCGGGAG GTGCGAGGCA GGAAAAATAT TGGATTCTTT 

201 AGAGAAGACT AGAGGTGACC AGTGACTGTG GCCCAGTAAT TAGAACTGTG 

251 GTGGCACAAG TCTGGCCCCA CATCCACCCA ATCCAAAACT GATAAGGATA 

3 01 TTTTGAAAAA CAGGAAAGCA GTACCTGTCT GATCCAGCTC TGGTATAGGT 

3 51 AGGAGTGAGT CCTGAACTGC TGGATTACAG ACTGGCTTGA GCCACAGAAG 

401 ATGATGGACC AGAGTAAAGT ATCATCACCT GCTCACAAGG CATGCTTCAC 

451 TAGAGAATAA TTCTAAAGAG GTGCCATGGA GGCAGCAGGA CAAGGCACAA 

501 GCAGTCTGGG TGGGGGTCAA GCCAGACCTA GTGCCACAGA ACAAGAGAGC 

551 AATC TGTG AC TAGTAGTTAG GGACTTTGTG GATGGGACAA GGGGCATGGG 

601 GGAAGAAATG AAAATATTCT TCCAATTACT TTCCAGTTCT CCTTTAGGGA 

651 CAGCTTAGAA TTATTTGCAC TATTGAGTCT TCATGTTCCC ACTTAAAAAC 

701 AAACAGATGC TCTGAAAGCA AACTGGCTTG AAATGGTGAC ACTTTGTCCC 

751 ACAAGCCACC AAATGTGGCA GTGTTTAGAA CTACCTGGAT CTGTATATAC 

801 CTG 



Fig . 5a 
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Teilsequenz des Nicht kodierenden RNA-Gens aus dem Kangeruh 

1 TTGCTGCATA TACTACTGAC CAGACAAGCT GTTTATCAGG CTTTTTAGGG 

51 TACACCAGCA CCTGCCCTCC ATTCATCCCT GTTGGGAGAG GGATGGTGTA 

101 CTGGTTGTCA CTAGAGACCT AACAGAGTAG GGTTAGTGGG AGCTTACATT 

151 TTCAGTGCCA TTAACATTCT AGTCCAAGGT CTTAAATTAT TATGTTGAGG 

201 GGTTTTTTTT CCCCTGAGGG GGCCGGGGGG TGGGGGGAGG GTTGATTAGA 

251 TTCCTTAGGA AAGAGGGTTG AGACAGACAG CAGAGCACTG AGCAGTTGGC 

3 01 ACTAAAGGAG ACCTTGACTA GGGGCCAGGT GGCATCATCT AATCCCAAGG 

3 51 GGCTCCAAGT GAGTATTAGG GTGGGGGAAG ACATTATAGA AGGAATAGAA 

401 ACAGGATAGC TCAGCCTAAA GAAGAGCGGT TAAAACCCTA CCCACCAGGA 

451 GTTGACTTGA AAGAGGCCCC TATGGAGGAA TCCCCAACCA CCAAAAGCAA 

501 TCTTGAGCTG CAGCTGCTTC ATTTAGTGGA CCTTGTGTAT ATCTGGGTGT 

551 GTATGCACAT AGATAGACAG TGAGAAAGAA AACTGTTCTT CCAGTTCTTT 

601 TCCAGTGCTA CTAGCTTAGG GACAGGTTAG AACTGTCTGC ACAATTGTGT 

651 GATCATTCCC ATTCCCACTT CAAAACAAAC TGACTGAGAT GTTCAACAGA 

701 AAACTGGCTT CAATGGGTAA CATGCCCTTG CCACTTACTT AAGACACTGG 

751 TGTGATGGGG TTTTGAACTC CCTATATTTG TAGGTATCTG 



Fig. 5b 
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Teilsequenz des Nicht kodierenden RNA-Gens aus dem Makaken 

1 TTGCTGCAGA TACTACTGAC CAGACAAGCT GTTGACCAGG CACCTCCCCT 

51 CCCGCCCAAA CCTTTCCCCC ATGTGGTCGT TAGAGACAGA GCAGTTGAGA 

101 GGACACTCCC GTTTTCGGTG CCATCAGTGC CCCGTCTACC ACTCCCCCAG 

151 CTCCCCCCAC CTCCCCCACT CCCAACCACG TTGGGACAGG GAGGTGTGAG 

2 01 GCAGGAGAGA CAGTTGGATT CTTTAGAGAT GGATGTGACC AGTGGCTATG 
251 GCCCGTGCGA TCCCACCCGT GGCGGCTCAA ATCTGGCCCC ACCCCAGCCC 

3 01 CAATCCAAAA CTGGCAAGGA CGCTTCACAG GACAGGAAAG TGGCACCTGT 
3 51 CTGTTCCGGC ATGGCTAGGA GGGAGTTGTC CCTTGAACTA CTGGGTGTAG 
401 ACTGGCCTAA ATCACAGGAG AGGATGGCCC AGGGTGAGGT GGCATGGTCC 
451 ATTCTCAAGG GACGTCCTCC AGTTGGTGGC ACTAGAGAGG CCATGGAGGC 
501 AGTAGGACAA GGCACAGGCA GGCTGGCCCA GGG TCAGGCC GGGCCGAACA 
551 CAGCGGGGTG AGAGGGATTC CTCGTC TC AG AGCAGTCTGT GACCGGTAGT 
601 TAGGGACTTA GTGGACAGGG AAGGGGCAAA GGGGGAGGAG AAGAAAATGT 
651 TCTTCCAGTT ACTTTCCAAT TCTACTCCTT TAGGGACAGC TTAGAATTAT 
701 TTGCACTATT GAGTCTTCAT GTTCCCACTT CAAAACAAAC AGATGCTCTG 
751 AGAGCAAACT GGCTTGAATT GGTGACGTTT AGTCCCTCAG GCCACCAGAT 
801 GTGATGGTGT TGAGAACTAC CTGGATATGT ATATATACCT G 



Fig, 5c 



Teilsequenz des 



1 


TTGCTGCAGA 


51 


CCCGCCCAAA 


101 


GGACACTCCC 


151 


CTCCCCCCAC 


201 


GCAGGAGAGA 


251 


ATGGCCTGTG 


301 


CCCCAATCCA 


351 


TGTCTGCTC C 


401 


TGGGTGTAGA 


451 


GCATGGTCCA 


501 


CATGGAGGCA 


551 


GGCAGGGCAC 


601 


TGACTGGTAG 


651 


GAAGAAAATG 


701 


AGAATTATTT 


751 


TGCTCTGAGA 


801 


ACCAGATGTG 



: kodierenden RNA-Gens 

TACTACTGAC CAGACAAGCT 
CCTTTCCCCC ATGTGGTCGT 
GTTTTCGGTG CCATCAGTGC 
CTCCCCCACT CCCAACCACG 
CAGTTGGATT CTTTCGAGAA 
CGATCCCACC CGTGGCGGCT 
AAACTGGCAA GGACGCTTCA 
AGCTCTGGCA TGGCTAGGAG 
CTGGCCTGAA CCACAGGAGA 
TTCTCAAGGG ACGTCCTCCA 
GTAGGACAAG GCGCAGGCAG 
AGCGGGGTGA GAGGGATTCC 
TTAGGGACTC AGTGGACAGG 
TTCTTCCAGT TACTTTCCAA 
GCACTATTGA GTCTTCATGT 
GCAAACTGGC TTGAATTGGT 
AGTGTTGAGA ACTACCTGGA 



aus dem Orang-Utan 

GTTGACCAGG CACCTCCCCT 
TAGAGACAGA GCAGTTGAGA 
CCCGTCTGCA GCTCCCCCAG 
TTGGGACAGG GAGGTGTGAG 
GATGGATATG ACCAGTGGCC 
CAAGTCTGGC CCCACACCAG 
CAGGACAGGA AAGTGGCACC 
GGAGTCGTCC CTTGAACTAC 
GGATGGCCCA GGGTGAGGTG 
ACGGGTGGCG CTAGAAAGGC 
GCTGGCCCGG GGTCAGGCCG 
TAATCACTCA GAGCAGTGTG 
GGAGGGGCGA GGGGGCAGGA 
TTCTCCTTTA GGGACAGCTT 
TCCCACTTCA AAACAAACGA 
GACATTTAGT CCCTCAAGCC 
TTTGTATATA TACCTG 



Fig. 5d 
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Teilsequenz des 



1 


TTGCTGCAGA 


51 


AACAACAACC 


101 


TAGAGAGGGC 


151 


TGTCCATAGC 


201 


ACTGGGAGGT 


251 


TATAGAGTTG 


301 


AAGTCTGGCT 


351 


AAAAATGAAA 

********** JU ^J**^*** 


401 


AC5TPTTAAAP 


451 


v_ \ VvAVjaVj X An 


Jul 




551 


GGAGTCAAGC 


601 


GTAGTTAAGG 


651 


TCCTTTAGGG 


701 


CACTTCAAAA 


751 


CACTGTCCCA 


801 


ATGTATATAC 



: kodierenden RNA-Gens 

TACTACTGAC CAGACAAGCT 
CCCTCCCTCC TCACCCCACC 
AATTGAGAGG ACACTCCCAT 
TTCCCTGACT TTTAC AC C AC 
GTGACGCAGG AGAAACTATA 
GCAAGTGATT GCGCCCCAGT 
CCACACCAAC CCAATCCAAA 
GTGGCATTTG TCTGATCCAG 
TGTTGGCTTA TAAACTGGCC 
AGTGTCATCA TCTGTTCACA 
GAAGTGCCAT GGAGGCAGCA 
CAGGCCTAGT GCCACAGAGC 
GGGAAGAAAG AAAAATATTC 
ACAGCTTAGA ATTATTTGCA 
CAAATAGATG CTCTGAAAGC 
CAAGCCACCA GACAATGGCA 
CTG 



aus der Ratte 

GTTGACCAGG CACTCCCCAC 
CCTATCCCCT GTGTGCTCAT 
TTTTGGTGCC ACTGATGCCC 
CCCAACTCCC AATCTGAGGG 
TAGGACTCTT GGGAGAAGAC 
AATTCCAACT GTGGTAGCAC 
ACTGACAAGG ACATTTTGCA 
CTCTGGCATG GCTAGAGATG 
TGAGCAACAG AAGAGGATGG 
AGGCATGCTC CCCTAGAAGT 
GGACAAAGTA CAGGCTAGGT 
AAGAGAGCAG TCTCTGACTA 
TTCCAATTGC TTTCCAGTTC 
CTATTGAGTC TTCATGTTCC 
AAACTGGCTT GAAATGGTGA 
GTGTTCAGAA CTACCTGTAT 



Fig. 5e 
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Teilsequenz des Nicht kodierenden RNA-Gens aus dem Schimpanzen 



1 


TTGCTGCAGA 


TACTACTGAC 


CAGACAAGCT 


GTTGACCAGG 


CACCTCCCCT 


51 


CCCGCCCAAA 


CCTTTCCCCC 


ATGTGGTCGT 


TAGAGACAGA 


GCGACAGAGC 


101 


AGTTGAGAGG 


ACACTCCCGT 


TTTCGGTGCC 


ATCAGTGCCC 


CGTCTACAGC 


151 


TCCCCCAGCT 


CCCCCCACCT 


CCCCCACTCC 


CAACCACGTT 


GGGACAGGGA 


201 


GGTGTGAGGC 


AGGAGAGACA 


GTTGGATTCT 


TTAGAGAAGA 


TGGATATGAC 


251 


CAGTGGCTAT 


GGCCTGTGTG 


ATCCCACCCG 


TGGTGGCTCA 


AGTCTGGCCC 


301 


CACACCAGCC 


CCAATCCAAA 


ACTGGCAAGG 


ACGCTTCACA 


GGACAGGAAA 


351 


GTGGCACCTG 


TCTGCTCCAG 


CTCTGGCATG 


GCTAGGAGGG 


GGGAGTCCCT 


401 


TGAACTACTG 


GGTGTAGACT 


GGCCTGAACC 


ACAGGAGAGG 


ATGGCCCAGG 


451 


GTGAGGTGGC 


GTGGTCCATT 


CTCAAGGGAC 


GTCCTCCAAC 


GGGTGGCGCT 


501 


AGAGGCCATG 


GAGGCAGTAG 


GACAAGGCGC 


AGGCAGGCTG 


GCCCGGGGTC 


551 


AGGCCGGGCA 


GAGCACAGCG 


GGGTGAGAGG 


GATTCCTAAT 


CACTCAGAGC 


601 


AGTCTGTGAC 


TTAGTGGACA 


GGGGAGGGGG 


CAAAGGGGGA 


GGAGAAGAAA 


651 


ATGTTCTTCC 


AGTTACTTTC 


CAATTCTCCT 


TTAGGGACAG 


CTTAGAATTA 


701 


TTTGCACTAT 


TGAGTCTTCA 


TGTTCCCACT 


TCAAAACAAA 


CAGATGCTCT 


751 


GAGAGCAAAC 


TGGCTTGAAT 


TGGTGACATT 


TAGTCCCTCA 


AGCCACCAGA 


801 


TGTGACAGTG 


TTGAGAACTA 


CCTGGATTTG 


TATATATACC 


TG 



Fig. 5f 
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SEQUENZ PROTOKOLL 

(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER : 

(A) NAME: Deutsches Krebsf orschungszentrum 

(B) STRASSE: Im Neuenheimer Feld 280 

(C) ORT: Heidelberg 

(E) LAND: Deutschland 

(F) POSTLEITZAHL : 69120 

(ii) BEZEICHNUNG DER ERFINDUNG: Modular aufgebaute RNA-Molekule mit 

zwei Sequenzbereichstypen 

(iii) ANZAHL DER SEQUENZ EN : 8 

<iv) COMPUTER- LESBARE FAS SUNG : 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 

(v) DATEN DER JETZIGEN ANMELDUNG: noch nicht bekannt 

(v) DATEN DER VORANMELDUNG : 

ANMELDENUMMER : DE 19828624.4 

DATUM DER VORANMELDUNG : 26-Jun-1998 

(2) ANGABEN ZU SEQ ID NO: 1: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 8422 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: cDNA 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 1: 

CTTAGAGTTT CGTGGCTTCA GGGTGGGAGT AGTTGGAGCA TTGGGGATGT TTTTCTTACC 60 

GACAAGCACA GTCAGGTTGA AGACCTAACC AGGGCCAGAA GTAGCTTTGC ACTTTTCTAA 120 

ACTAGGCTCC TTCAACAAGG CTTGCTGCAG ATACTACTGA CCAGACAAGC TGTTGACCAG 180 

GCACCTCCCC TCCCGCCCAA ACCTTTCCCC CATGTGGTCG TTAGAGACAG AGCGACAGAG 240 

CAGTTGAGAG GACACTCCCG TTTTCGGTGC CATCAGTGCC CCGTCTACAG CTCCCCCAGC 300 

TCCCCCCACC TCCCCCACTC CCAACCACGT TGGGACAGGG AGGTGTGAGG CAGGAGAGAC 360 

AGTTGGATTC TTTAGAGAAG ATGGATATGA CCAGTGGCTA TGGCCTGTGC GATCCCACCC 420 

GTGGTGGCTC AAGTCTGGCC CCACACCAGC CCCAATCCAA AACTGGCAAG GACGCTTCAC 480 

AGGACAGGAA AGTGGCACCT GTCTGCTCCA GCTCTGGCAT GGCTAGGAGG GGGGAGTCCC 540 

TTGAACTACT GGGTGTAGAC TGGCCTGAAC CACAGGAGAG GATGGCCCAG GGTGAGGTGG 600 

C ATGGTC CAT TCTCAAGGGA CGTCCTCCAA CGGGTGGCGC TAGAGGCCAT GGAGGCAGTA 660 




2 



GGACAAGGTG 


CAGGCAGGCT 


GGCCTGGGGT 


CAGGCCGGGC 


AGAGCACAGC 


GGGGTGAGAG 


720 


GGATTCCTAA 


TCACTCAGAG 


CAGTCTGTGA 


CTTAGTGGAC 


AGGGGAGGGG 


GCAAAGGGGG 


780 


AGGAGAAGAA 


AATGTTCTTC 


CAGTTACTTT 


CCAATTCTCC 


TTTAGGGACA 


GCTTAGAATT 


840 


ATTTGCACTA 


TTGAGTCTTC 


ATGTTCCCAC 


TTCAAAACAA 


ACAGATGCTC 


TGAGAGCAAA 


900 


CTGGCTTGAA 


TTGGTGACAT 


TTAGTCC CTC 


AAGCCACCAG 


ATGTGACAGT 


GTTGAGAACT 


960 


ACCTGGATTT 


GTATATATAC 


CTGCGCTTGT 


TTTAAAGTGG 


GCTCAGCACA 


TAGGGTTCCC 


1020 


ACGAAGCTCC 


GAAACTCTAA 


GTGTTTGCTG 


CAATTTTATA 


AGGACTTCCT 


GATTGGTTTC 


1080 


TCTTCTCCCC 


TTCCATTTCT 


GCCTTTTGTT 


CATTTCATCC 


TTTCACTTCT 


TTCCCTTCCT 


1140 


CCGTCCTCCT 


CCTTCCTAGT 


TCATCCCTTC 


TCTTCCAGGC 


AGCCGCGGTG 


CCCAACCACA 


1200 


CTTGTCGGCT 


CCAGTCCCCA 


GAACTCTGCC 


TGC CCTTTGT 


CCTCCTGCTG 


CCAGTACCAG 


1260 


CCCCACCCTG 


TTTTGAGCCC 


TGAGGAGGCC 


TTGGGCTCTG 


CTGAGTCCAA 


CCTGGCCTGT 


1320 


CTGTGAAGAG 


CAAGAGAGCA 


GCAAGGTCTT 


GCTCTCCTAG 


GTAGCCCCCT 


CTTCCCTGGT 


1380 


AAGAAAAAGC 


AAAAGGCATT 




AACAACGAGC 


CTTTTCACCC 


TTCTACTCTA 


1440 


GAGAAGTGGA 


CTGGAGGAGC 


TGGGCCCGAT 

X V* \v \Jxl X 


TTGGTAGTTG 

x x x rwj x x vj 


AGGAAAGCAC 


AGAGGCCTCC 


1500 


TGTGGPP TGP 


PAGTrATTGA 


GTGGCCCAAC 


AGGGGCTCCA 


TGCGAGC CG A 


C CTTG ACC TC 


1560 


APTTAGAAGT 


P PAGAGTCTA 


GCGTAGTGCA 


GCAGGGCAGT 


AGCGGTACCA 


ATGCAGAACT 


1620 


CCCAAGACCC 


GAGC TGGG AC 


CAGTACCTGG 


GTCCCCAGCC 


CTTCCTCTGC 

V— ' X X W X X VJ\» 


TCCCCCTTTT 


1680 


CCCTCGGAGT 


TCTTCTTGAA 

X X X V_~ X X VJXi-iTV 


TGGCAATGTT 

X VJxJVH-iiTx X \J X X 


TTGCTTTTGC 

X X \Jw X X X X VJVf 


TCGATGCAGA 


CAGGGGGCCA 


1740 


GAACACCACA 


CATTTCACTG 


TCTGTCTGGT 


CCATAGCTGT 


GGTGTAGGGG 


CTTAGAGGCA 


1800 


TGGGCTTGCT 


GTGGGTTTTT 


AATTGATCAG 


TTTTCATGTG 


GGATCCCATC 


TTTTTAACCT 


1860 


CTGTTCAGGA 


AGTCCTTATC 


TAGCTGCATA 


TCTTCATCAT 


ATTGGTATAT 


CCTTTTCTGT 


1920 


GTTTACAGAG 


ATGTCTCTTA 


TATCTAAATC 


TGTCCAACTG 


AGAAGTACCT 


TATCAAAGTA 


1980 


GCAAATGAGA 


CAGCAGTCTT 


ATGCTTCCAG 


AAACACCCAC 


AGGCATGTCC 


CATGTGAGCT 


2040 


GCTGCCATGA 


ACTGTCAAGT 


GTGTGTTGTC 


TTGTGTATTT 


CAGTTATTGT 


CCCTGGCTTC 


2100 


CTTACTATGG 


TGTAATCATG 


AAGGAGTGAA 


ACATCATAGA 


AACTGTCTAG 


CACTTCCTTG 


2160 


CGAGTCTTTA 


GTGATCAGGA 

VJ X wix X wixVJxJxx 


ACCATAGTTG 


ACAGTTCCAA 


TCAGTAGCTT 


AAGAAAAAAC 


2220 


VufVJ X VJ XXX. >J X Vw- 


TCTTCTGGAA 


TGGTTAGAAG 


TGAGGGAGTT 


TGCCCCGTTC 


TGTTTGTAGA 


2280 


RTTTPATART 

X v_ X X ^AnJ X 


TGG A CI^TTC T 

X VJVJ<n\~ X X X V* X 


AGCATATATG 


TGTCCATTTC 

X VJ X \— V^*i X X X V*- 


CTTATGCTGT 


AAAAGCAAGT 


2340 


CCTGCAACCA 


AACTCCCATC 


AGCCCAATCC 


CTGATCCCTG 


ATCCCTTCCA 


CCTGCTCTGC 


2400 


TGATGACCCC 


CCCAGCTTCA 


CTTCTGACTC 


TTCCCCAGGA 


AGGGAAGGGG 


GGTCAGAAGA 


2460 


GAGGGTGAGT 


CCTCCAGAAC 


TCTTCCTCCA 


AGGACAGAAG 


GCTCCTGCCC 


CCATAGTGGC 


2520 


CTCGAACTCC 


TGGCACTACC 


AAAGGACACT 


TATCCACGAG 


AGCGCAGCAT 


CCGACCAGGT 


2580 


TGTCACTGAG 


AAGATGTTTA 


TTTTGGTCAG 


TTGGGTTTTT 


ATGTATTATA 


CTTAGTCAAA 


2640 


TGTAATGTGG 


CTTCTGGAAT 


CATTGTCCAG 


AGCTGCTTCC 


CCGTCACCTG 


GGCGTCATCT 


2700 




3 



PPTPPTGGTA 

V7V7 X W X \J\J X 


APAPPAPTPP 
avj aovj a vj x v?v_> 






GTPAPPPATG 
vj x \— ua x w 


ACAGTTPATT 


£i l \J\J 


V^AVjVjOV V X 


PPPT1P A PTPP 

VjVjVJVJVAVJ X W_7 


TP^TTPJZP, A A 


PAPAPPATTT 


PAAPPPTPAP 


TTTATTTP AT 

XXX A^ XXX Vu> A. X 


ooon 

£t O Z. U 


X VVjrVTOV V V VA 


PPTPPAPPTP 

W X Vjr\_»A.OV X V— 


PPT*PAAAPAP 


PP APTTPPPP 


APP PTPTTTP 

A\JV- X V^. X X X 


PPTTPPAGTT 




x a. x x Lwiunu 


PTGPPAGTGG 


PPPPTPAPPP 


TPPTTAPPPT 

X V*. X X fWJ\J\J X 


XXX Vv X V X V X A 


TTTPPCPPTT 

XXX Vw V— N— V— X X 


2940 


TpTTpPTPAT 


TpppTPGTPT 


TTPP P AAAPP 


PATPAPPAGT 


PAGTPGPPTT 


TCAGCAGGCA 


3000 


UVU X x vjvjv_vjvj 


TTTATPGPPP 


T*PPPAf5PPAP 


PPPPPPTPPA 


Vjv, X V X V-A X vjV— 


TpppppTGPP 


3060 


X X OV3V30 X wlVJ 


PTTPAPAPPA 
vj x x vjA^.no\jA 


OVJ X X VJVJriVJVJVJ 


AAAPPPTTAA 


GPTPPAGGAT 


TPTPACCAGC 


3120 


tptptp pppp 

X V7 X O X V_ V_- VJV_7\_ 


pp apttttpp 

v_. Crio x x x x o\j 


PPTPTPAPPT 


PA ATTTPAAT 
v_^Ajtv xxx v_xiri x 


XXX V3 X V X \J X 


PTTGAAPATT 


3180 


ATPAAPATPP 
A X Vj AAVj A X Ovj 


PPPPP TPTTT 

VjVjVjW X V X X X 


PAPTPAATTT 

wr^w X UAn XXX 


PTPAAPAPPA 


G AATTGAP PG 


ACAGCTTTCC 

XiwxlVJ\# XXX V w 


3240 


A PT A PP P A TT1 
X Av_v_. VA x v3 


PPPPT A PPTP 

VjrVjVJjV X AVJVj X V 


ATTAAPPPPA 


PATPPAPAPT 


prrrrrrArc 

V— X WV^WA.W 


PTTGTTPPAG 


3300 


X X \3 X X AVj lln 


OTAPPTPPTP 
V X AV— V— X W X V 


TPPTP A P A AT 


A PfPT A TPTP 


PTPPAPPT*PP 


PPPPARGTPT 

W V— \_AVJVJ X V— X 


J J U VJ 


ALLLL xL-L-V-Vj 


LrLLL. 1 VJVV 1 VJ 




rru^mpi a rnA PiPP 


A PTPPP A TTP 

AO X VJOOA X X \jr 


PPPPTPTTPA 
wvjrvj x V— x xaja 


J 1 A V 


CAVjC J/L At? 1\j 


ALtL, I \ JVJ ALt A 1 


At, 1 1 vjvj 1 AL. 


ALtL. L-ALtVjL. vjL. 


T A rxP" 1 A r^ 1 A PiO T 1 
1 avjL.AL.AoL. 1 


PPPTTPTYUTT 
L.L.L. X 1 V_ 1 vjt 1 1 


Aft n 


vj ATGL. I o 1 A I 


rTV , 0/^ A Tl A l"PP"* A 

rCCC A I A I L. A 


A A APPP^ O A P 1 

AAALt(jCAL-AUt 


n/^r* a o a P'P'P^ a 
LtLtLjAL-AL L.L- A 


p* aaa e^nr^c* a p* 

oaaALvtLLAL 


AlLLLLtAftl 




L L- ATCAvjTvjL. 


LAAAL I AvjL, L 


A APP/V'PPPJi 

AAL CHiCC A 


LtL, 1 1L 1 L-ALiL- 


TW'O'TYZP"* A TV 


uvuuaauV X\jt 




p»rn a p'ov'/tup* 1 a 
L 1 AL. IvCj IXjA 


(~^{~^ A OTV~ , P' 

vjCLtL-L-Avj 1 vjL. 


OOP^rTAOO TiPAP 

Lt(jCj i vjH-ALjAL- 


AA 1 L- I 1 L. l\jr 1 


TVPlPlP^ 'yPIPlO A T 
1 vjLtVj IuuLa 1 


PA TTPP A PPP 
V— Ax IVVavajV 


J U U v 


L L. o AAviL, A 1\j 


A A P* A PT1PP A P"» 

AAL Avj IajL. AC 


P^TV^PIO A P' A P^ 1 


O A PIP^ A PlP^P x P , P , 
\j AIjV^ AVjL. L. L. L 


A A ATTP'FP AP 
AAA X X Vj 


PTPPTTPTPT 
V X Vj\— X XV X V X 


3720 


ncr^r* a pifTTr 

VjV— L.L.AVJL. ill 


tv™ 1 a TTfu^TfiT 

X VA J. 1 VJV_ 1 \j l 


P2 A P 1 A PT*P A TYi 


PPP A A AP APP 


PT A ATA APP A 

Vj X AA X AAV— V_A 


GAPAPAAAPT 


3780 


VjVLaaLtx 


f2TY2/7AP^A A AP. 

\Sf XV5\JAVJAAA.VJ 


P A PTTTPTTT 1 


APPTPAPAPA 


ATP TPTP AAT 

A XV XV. 1 V3AA X 


TTTAAATCAP 


3840 


TTAPTA APZPP 


PiOTP A APPPP 


APPAPPPAPP 


APAPPPATAP 


PAPPPPAPTP 


CCCTGCGCGG 


3900 


P APPATPTPP 
unLLn x v_ x vjvj 


A ATTPPTTTA 
nni x vj\j xxx a 


PPPPAAPTPP 


APPPTGAPAG 

llvJV. \— . X \JA\>iAVJ 


PPAGAAPTCT 


GTGTCCCCCG 


3960 


TPTAAPPAPA 


PPT l PP r T u T u T ir PP 

VJJ\_ X W X X X X V. 


PAPAPPATTP 


PAGTCAGGCT 


CTCTGGGCTG 


ACTGGGCCAG 


4020 


PPPAPPTTAP 

VJVJV3 AVJVJ X X 


APPTAPPAPT 


TTTTTAAfiAA 


GATPTTTGGG 

VJA X \v XXX vJXJXJ 


CATATACATT 


TTTAGCCTGT 


4080 


\3 1 V^ A X XVJVV-.V— 


PA A ATPPATT 
VAAA X VjvjA X X 


cr ir vcz r r tr T v T i c a a 


PTTPAPAPPT 

\J X X V«AUAL>\« X 


GPAGATTCTA 

V7VAV7A X X V— X n. 


GGACCTGTGT 


4140 


V- L 1 avjaL. 1 


a cine a p 1 tp"* a pi 

avjLtvjavj 1 V- avj 


/™ ,r pp , 'i u i w i'p ,,r p A Pi 


A PTTPPT A P P 

AVJ X X V_V_ X AV,V>, 


ATGGAGTGGG 

r\ X VJVTAO X wV7\7 


TCTGGAGGAC 


4200 


L l\jV_ vL-VjVj 1 \j 




pppr"pr/ ,r rr , p 


V_ X L\vUU\3 1L1 


TPPTAPTPTT 

X W X AV_ X V_ X X 


PTPTPTGPTC 


4260 


IvjAL-vjvjLtAx 1 


X Vj 1 I vj A 1 1 Li 


Ptppp A rrurujinv; 
L1LLAJ, 1 1 lu 


x V3 1L1 1 IV 1 


PTTTT AP AT A 

V— X X X X AVjA X A 


TTPTATPAAT 


4320 


CTTTAGAAAA 


GGL. A\L AL» 1C 1 


A P^lTUTV^fTVr* A rn A 

AL. 1 L\j 1 1 A 1 A 


A A *TV~ , P ,r P r P AP1P2 

AA XV- Lt 1 1 ALtvj 


ATA P^TPPPTP 

A X AL 1 VjV_V_ 1\, 


PPPPAPGGTP 


4380 


TAAAATTACA 


TATTAGAGGG 


GAAAAGCTGA 


ACACTGAAGT 


CAGTTCTCAA 


CAATTTAGAA 


4440 


GGAAAACCTA 


GAAAACATTT 


GGCAGAAAAT 


TACATTTCGA 


TGTTTTTGAA 


TGAATACAAG 


4500 


CAAGCTTTTA 


CAACAGTGCT 


GATCTAAAAA 


TACTTAGCAC 


TTGGCCTGAG 


ATGCCTGGTG 


4560 


AGCATTACAG 


GCAAGGGGAA 


TCTGGAGGTA 


GCCGACCTGA 


GGACATGGCT 


TCTGAACCTG 


4620 


TCTTTTGGGA 


GTGGTATGGA 


AGGTGGAGCG 


TTCACCAGTG 


ACCTGGAAGG 


CCCAGCACCA 


4680 


CCCTCCTTCC 


CACTCTTCTC 


ATCTTGACAG 


AGCCTGCCCC 


AGCGCTGACG 


TGTCAGGAAA 


4740 




4 



ACACCCAGGG 


AACTAGGAAG 


GCACTTCTGC 


CTGAGGGGCA 


GCCTGCCTTG 


CCCACTCCTG 


4800 


CTCTGCTCGC 


CTCGGATCAG 


CTGAGCCTTC 


TGAGCTGGCC 


TCTCACTGCC 


TCCCCAAGGC 


4860 


CCCCTGCCTG 


CCCTGTCAGG 


AGGCAGAAGG 


AAGCAGGTGT 


GAGGGCAGTG 


CAAGGAGGGA 


4920 


GCACAACCCC 


CAGCTCCCGC 


TCCGGGCTCC 


GACTTGTGCA 


CAGGCAGAGC 


CCAGACCCTG 


4980 


GAGGAAATCC 


TACCTTTGAA 


TTCAAGAACA 


TTTGGGGAAT 


TTGGAAATCT 


CTTTGCCCCC 


5040 


AAACCCCCAT 


TCTGTCCTAC 


CTTTAATCAG 


GTCCTGCTCA 


GCAGTGAGAG 


CAGATGAGGT 


5100 


GAAAAGGCCA 


AGAGGTTTGG 


CTCCTGCCCA 


CTGATAGCCC 


CTCTCCCCGC 


AGTGTTTGTG 


5160 


TGTCAAGTGG 


CAAAGCTGTT 


CTTCCTGGTG 


ACCCTGATTA 


TATCCAGTAA 


CACATAGACT 


5220 


GTGCGCATAG 


GCCTGCTTTG 


TCTCCTCTAT 


CCTGGGCTTT 


TGTTTTGCTT 


TTTAGTTTTG 


5280 


CTTTTAGTTT 


TTCTGTCCCT 


TTTATTTAAC 


GCACCGACTA 


GACACACAAA 


GCAGTTGAAT 


5340 


TTTTATATAT 


ATATCTGTAT 


ATTGCACAAT 


TATAAACTCA 


TTTTGCTTGT 


GGCTCCACAC 


5400 


ACACAAAAAA 


AGACCTGTTA 


AAATTATACC 


TGTTGC TTAA 


TTACAATATT 


TCTGATAACC 


5460 


ATAGCATAGG 


ACAAGGGAAA 


ATAAAAAAAG 


AAAAAAAAGA 


AAAAAAAACG 


AC AAATC TGT 


5520 


CTGCTGGTCA 


CTTCTTCTGT 


CCAAGCAGAT 


TCGTGGTCTT 


TTCCTCGCTT 


CTTTCAAGGG 


5580 


CTTTCCTGTG 


CCAGGTGAAG 


GAGGCTCCAG 


GCAGCACCCA 


GGTTTTGCAC 


TCTTGTTTCT 


5640 


CCCGTGCTTG 


TGAAAGAGGT 


CCCAAGGTTC 


TGGGTGCAGG 


AGCGCTCCCT 


TG AC CTGCTG 


5700 


AAGTCCGGAA 


CGTAGTCGGC 


ACAGCCTGGT 


CGCCTTCCAC 


CTCTGGGAGC 


TGGAGTCCAC 


5760 


TGGGGTGGCC 


TGACTCCCCC 


AGTCCCCTTC 


CCGTGACCTG 


GTCAGGGTGA 


GCCCATGTGG 


5820 


AGTCAGCCTC 


GCAGGCCTCC 


CTGCCAGTAG 


GGTCCGAGTG 


TGTTTCATCC 


TTCCCACTCT 


5880 


GTCGAGCCTG 


GGGGCTGGAG 


CGGAGACGGG 


AGGCCTGGCC 


TGTCTCGGAA 


CCTGTGAGCT 


5940 


GCACCAGGTA 


GAACGCCAGG 


GACCCCAGAA 


TCATGTGCGT 


CAGTCCAAGG 


GGTCCCCTCC 


6000 


AGGAGTAGTG 


AAGACTCCAG 


AAATGTCCCT 


TTCTTCTCCC 


CCATCCTACG 


AGTAATTGCA 


6060 


TTTGCTTTTG 


TAATTCTTAA 


TGAGCAATAT 


CTGCTAGAGA 


GTTTAGCTGT 


AACAGTTCTT 


6120 


TTTGATCATC 


TTTTTTTAAT 


AATTAGAAAC 


ACCAAAAAAA 


TCCAGAAACT 


TGTTC TTCC A 


6180 


AAGCAGAGAG 


CATTATAATC 


ACCAGGGCCA 


AAAGCTTCCC 


TCCCTGCTGT 


CATTGCTTCT 


6240 


TCTGAGGCCT 


GAATCCAAAA 


GAAAAACAGC 


CATAGGCCCT 


TTCAGTGGCC 


GGGCTACCCG 


6300 


TGAGCCC TTC 


GGAGGACCAG 


GGCTGGGGCA 


GCCTCTGGGC 


CCACATCCGG 


GGCCAGCTCC 


6360 


GGCGTGTGTT 


CAGTGTTAGC 


AGTGGGTCAT 


GATGCTCTTT 


CCCACCCAGC 


CTGGGATAGG 


6420 


GGCAGAGGAG 


GCGAGGAGGC 


CGTTGCCGCT 


GATGTTTGGC 


CGTGAACAGG 


TGGGTGTCTG 


C A O f\ 


CGTGCGTCCA 


CGTGCGTGTT 


TTCTGACTGA 


CATGAAATCG 


ACGCCCGAGT 


TAGCCTCACC 


6540 


CGGTGACCTC 


TAGCCCTGCC 


CGGATGGAGC 


GGGGCCCACC 


CGGTTCAGTG 


TTTCTGGGGA 


6600 


GCTGGACAGT 


GGAGTGCAAA 


AGGCTTGCAG 


AACTTGAAGC 


CTGCTCCTTC 


CCTTGCTACC 


6660 


ACGGCCTCCT 


TTCCGTTTGA 


TTTGTCACTG 


CTTCAATCAA 


TAACAGCCGC 


TCCAGAGTCA 


6720 


GTAGTCAATG 


AATATATGAC 


CAAATATCAC 


CAGGACTGTT 


ACTCAATGTG 


TGCCGAGCCC 


6780 
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TTGCCCATGC 


TGGGCTCCCG 


TGTATCTGGA 


CACTGTAACG 


TGTGCTGTGT 


TTGCTCCCCT 


6840 


TCCCCTTCCT 


TCTTTGCCCT 


TTACTTGTCT 


TTCTGGGGTT 


TTTCTGTTTG 


GGTTTGGTTT 


6900 


GGTTTTTATT 


TCTCCTTTTG 


TGTTCCAAAC 


ATGAGGTTCT 


CTCTACTGGT 


CCTCTTAACT 


6960 


GTGGTGTTGA 


GGCTTATATT 


TGTGTAATTT 


TTGGTGGGTG 


AAAGGAATTT 


TGCTAAGTAA 


7020 


ATCTCTTCTG 


TGTTTGAACT 


GAAGTCTGTA 


TTGTAACTAT 


GTTTAAAGTA 


ATTGTTCCAG 


7080 


AGACAAATAT 


TTCTAGACAC 


TTTTTCTTTA 


CAAACAAAAG 


CATTCGGAGG 


GAGGGGGATG 


7140 


GTGACTGAGA 


TGAGAGGGGA 


GAGCTGAACA 


GATGACCCCT 


GCCCAGATCA 


GCCAGAAGCC 


7200 


ACCCAAAGCA 


GTGGAGCCCA 


GGAGTCCCAC 


TCCAAGCCAG 


CAAGCCGAAT 


AGCTGATGTG 


7260 


TTGCCACTTT 


CCAAGTCACT 


GCAAAACCAG 


GTTTTGTTCC 


GCCCAGTGGA 


TTCTTGTTTT 


7320 


GCTTCCCCTC 


CCCCCGAGAT 


TATTACCACC 


ATCCCGTGCT 


TTTAAGGAAA 


GGCAAGATTG 


7380 


ATGTTTCCTT 


GAGGGGAGCC 


AGGAGGGGAT 


GTGTGTGTGC 


AGAGCTGAAG 


AGCTGGGGAG 


7440 


AATGGGGCTG 


GGCCCACCCA 


AGCAGGAGGC 


TGGGACGCTC 


TGCTGTGGGC 


ACAGGTCAGG 


7500 


CTAATGTTGG 


CAGATGCAGC 


TCTTCCTGGA 


CAGGCCAGGT 


GGTGGGCATT 


CTCTCTCCAA 


7560 


GGTGTGCCCC 


GTGGGCATTA 


CTGTTTAAGA 


CACTTCCGTC 


ACATCCCACC 


CCATCCTCCA 


7620 


GGGCTCAACA 


CTGTGACATC 


TCTATTCCCC 


ACCCTCCCCT 


TCCCAGGGCA 


ATAAAATGAC 


7680 


CATGGAGGGG 


GCTTGCACTC 


TCTTGGCTGT 


CACCCGATCG 


CCAGCAAAAC 


TTAGATGTGA 


7740 


GAAAACCCCT 


TCCCATTCCA 


TGGCGAAAAC 


ATCTCCTTAG 


AAAAGCCATT 


ACCCTCATTA 


7800 


GGCATGGTTT 


TGGGCTCCCA 


AAACACCTGA 


CAGCCCCTCC 


CTCCTCTGAG 


AGGCGGAGAG 


7860 


TGCTGACTGT 


AGTGACCATT 


GCATGCCGGG 


TGCAGCATCT 


GGAAGAGCTA 


GGCAGGGTGT 


7920 


CTGCCCCCTC 


CTGAGTTGAA 


GTCATGCTCC 


CCTGTGCCAG 


CCCAGAGGCC 


GAGAGCTATG 


7980 


GACAGCATTG 


CCAGTAACAC 


AGGCCACCCT 


GTGCAGAAGG 


GAGCTGGCTC 


CAGCCTGGAA 


8040 


ACCTGTCTGA 


GGTTGGGAGA 


GGTGCACTTG 


GGGCACAGGG 


AGAGGCCGGG 


ACACACTTAG 


8100 


CTGGAGATGT 


CTCTAAAAGC 


CCTGTATCGT 


ATTCACCTTC 


AGTTTTTGTG 


TTTTGGGACA 




ATTACTTTAG 


AAAATAAGTA 


GGTCGTTTTA 


AAAACAAAAA 


TTATTGATTG 


CTTTTTTGTA 


8220 


GTGTTCAGAA 


AAAAGGTTCT 


TTGTGTATAG 


CCAAATGACT 


GAAAGCACTG 


ATATATTTAA 


8280 


AAACAAAAGG 


CAATTTATTA 


AGGAAATTTG 


TACCATTTCA 


GTAAACCTGT 


CTGAATGTAC 


8340 


CTGTATACGT 


TTCAAAAACA 


CCCCCCCCCC 


ACTGAATCCC 


TGTAACCTAT 


TTATTATATA 


8400 


AAGAGTTTGC 


CTTATAAATT 


TA 








8422 



(2) ANGABEN ZU SEQ ID NO: 2: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 8464 Basenpaare 

(B) ART: Nucleotid 

<C) STRANGFORM: nicht bekannt 
(D) TOPOLOGIE: nicht bekannt 
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(ii) ART DES MOLEKULS : cDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 



CTTAGAGTTT 


CGTGGCTTCG 


GGGTGGGAGT 


AGTTGGAGCA 


TTGGGATGTT 


TTTCTTACCG 


60 


ACAAGCACAG 


TCAGGTTGAA 


GACCTAACCA 


GGGCCAGAAG 


TAGCTTTGCA 


CTTTTCTAAA 


120 


CTAGGCTCCT 


TCAACAAGGC 


TTGCTGCAGA 


TACTACTGAC 


CAGACAAGCT 


GTTGACCAGG 


180 


CACTCCCCCC 


AACAATATCC 


TCCCTCTTCC 


CCCCCCCCAC 


CCCCGCCCCG 


TGTGCTCGTT 


240 


AGGGCAATTG 


AAAGGACACT 


CCCATTTTTG 


GTGCCATTGA 


TGCCCTGTCC 


ATAATAGCTT 


300 


CCCTGACTTT 


TACACCACCC 


CAACTCCCAA 


TCTGAAGGAC 


TGGGAGGTGT 


GATGCAGGAG 


360 


AAACTATGGG 


ACTCTTGGGA 


GAAGACTATG 


GAGTTGGCCA 


GTGATTAAGG 


CCCACTAATT 


420 


CCAACTGTGG 


TAGCACAGAT 


CTGGCTCCAC 


ATCAACCCAA 


TCCAAAACTG 


ACAAGGATAT 


480 


TTTGCAAAAA 


AAGAAAGTGG 


CACCTGTCTG 


ATCCAGCTCT 


GACATGGCTA 


GAGGTGAGTC 


540 


CTAAACTGAT 


GGCTTATAAA 


CTAGCCTGAG 


CCACAGAAGA 


GTATGGCCCA 


GAGTGAAGTG 


600 


TCATCATCTG 


TTCACAAGGC 


ATGCTCCCCT 


AGAAGATAAT 


GCTAAAGAGG 


TGCCATGGAG 


660 


GCAGCAGGAC 


AAAGTACAGG 


CAGGCTAGGT 


GGAGTCAAGC 


CAGGCCTAGT 


GCCACAGAAC 


720 


AAGAGAGCAG 


TCTGACTAGT 


AATTAAGAGG 


GAAGAAAGGA 


AAATATTCTT 


CCAATTACTT 


780 


TCCAGTTCTC 


CTTTAGGGAC 


AGCTTAGAAT 


TATTTGCACT 


ATTGAGTCTT 


CATGTTCCCA 


840 


CTTCAAAACA 


AACAGATGCT 


CTGAAAGCAA 


ACTGGCTTGA 


AATGGTGACA 


CTGTCCCACA 


900 


AGCCACCAGA 


CATGGCAGTG 


TTCAGAACTA 


CCTGTATCTG 


TATATACCTG 


CGCTTGTTTT 


960 


AAAGTGGGCT 


CAGCACATAG 


GATTCCCAAG 


AAGCTCCGAA 


ACTCTAAGTG 


TTTGCTGCAA 


1020 


TTTTATAAGG 


ACTTCCTGAT 


TGCTTTCTCT 


CTCGTCCTTC 


CATTTCTTCC 


TTCCTTCCAT 


1080 


TTCATGCTTT 


CATTTCTTCC 


CCTAGCTTCT 


AGTTGTTTCT 


TCTGTTCCAG 


GCAGCTGCAG 


1140 


TGCTGAACCA 


CATGGTTACC 


TAACAGCAGT 


CAGCTGCAGC 


CCTAGGATTC 


TTCCTGCCCT 


1200 


TTAACTTCCC 


ATTGCCAGTG 


CCAGGTATCA 


TATTTAACCT 


TGAGCAAGAG 


CTGGGCTCTT 


1260 


TTGAGCCCTC 


CCTAACCTCT 


GTGAAGAAGA 


ACAAGAAGGT 


AGGAAGCTCT 


TGCTCTTGCT 


1320 


AAGAAAAATG 


TCAAAAGGCT 


TTCAGACCTT 


AAACAATGAG 


CCTTTTCACC 


TTTTACTCTA 


1380 


GAAAAGTGGA 


CTAGAAAATC 


TGGGTCACAT 


TGGGTAGCTG 


AAGGAGATAC 


AGAGGCCCCT 


1440 


ATGGCCTGCC 


AGAGTCGTTG 


CATGGCCCAA 


CAGGGGCTCC 


ATGCCCACTA 


CCCTTGACCC 


1500 


TACTCAGAAA 


TCTAATGTCA 


TACTTAGTGT 


GGGCAGGGGA 


CCTGTCAGGA 


CAGATGCAGA 


1560 


CCTAAGCAGG 


GAGTGACACC 


AGGGCCCTTG 


GCCCTTCTTC 


TGACAAACAT 


ACACATCCCA 


1620 


AGTCTTTTTC 


TAGTGGAATT 


CTTAACCTCT 


TGCTCACTGG 


GGACTGGGAA 


GCATCAGCAC 


1680 


ATCCCATATT 


TCAAACTCTG 


CTCCATAAGT 


ACAGTGGTGA 


ATTTTATAGA 


CTTGACTTTG 


1740 


CTGTGGGGTT 


TTAATTGGTC 


AGTTTTAATT 


TGGGATCCCA 


AAGTTTTAAC 


CTCCATTCAG 


1800 


GAAGTCCTTA 


TCTAGCTGCA 


TATCTTCATC 


ATATTGGTAT 


ATCCTTTTCT 


GTGTTTACAG 


1860 



• 
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AGATGTCTCA 


TATCTATCGA 


AATCTGTCTG 


AGAAGTACCT 


TATCAAAGTA 


GCAAATGAGA 


1920 


CAGCAGTCTT 


ATGCTTCCAG 


AAACACCCAC 


AGGCACGTCC 


CATGTGAGCT 


GCTGCCATGA 


1980 


ACTGTCGAGT 


GTGTATTGTC 


TTGTGTATTT 


TCGTTAACGT 


TCCCCAGCTT 


CCTTCCTGCG 


2040 


GTGTAATCAT 


GGAAGAGTGA 


AACATCATAG 


AAATCGTCTA 


GCACTTCCTG 


GCCAGTCCTT 


2100 


AGTGATCAGG 


AACCGTAGTT 


GACAGTTCCA 


ATTGATAGCT 


TAAGATAAAA 


CCATGTTTGT 


2160 


CTCTTATGGA 


ATGGTTAGAA 


CTAAGTGAGA 


GATCTTGC C C 


CATTCTGTTT 


GCCGAATCAT 


2220 


AGTTGGACTT 


TTAGTGTATT 


TGTATCCATT 


TCCTTGTGCT 


ATAAAAGCAA 


ACCCTGCAAC 


2280 


CAGCTTTCTG 


TCAGGCAGTC 


CTTTTGCCTG 


CTCTGCTTTT 


GATCCTCTTA 


GTCTTGCTTC 


2340 


TGGTTCCTCC 


CTGGAGAGGG 


AGGAGGGGTC 


AGAAGAGGAA 


TTCTGGAGGA 


TCCAGGATAT 


2400 


GTCCTTCTGA 


ACTCCTGCTT 


CTTCCAGTGA 


CAAAAGGCCC 


CTACTGCCCC 


ACCCCAACCT 


2460 


GCCCCATGCA 


CTCCTCTAGG 


ACACCTTTCC 


ATACTTTTCA 


CAACACCTAG 


CCAGGTTGAC 


2520 


ACCAAGTTGT 


TTATTGTGGT 


CTGCTTGGAA 


TTTTACCTGT 


TAGGCTTACT 


TAGTCCAATC 


2580 


AAATGGACTC 


CAAGTTGGGT 


ATCCCTCATC 


TTTGGAAGAC 


AACCTAGGCT 


GATTAGATAT 


2640 


TTACTTTTGG 


GATTGCAGCA 


CTTTGGGTGC 


CGTTTTTCTT 


TTACTTGGGT 


TTTATCTGCA 


2700 


GCTCCCTCAC 


CACCACCACC 


ACCCCCCACT 


TACCTGTATG 


TAGAACTGAT 


TTCAAAACTG 


2760 


CAGGTGGTGG 


TAACTGCAGC 


TTCTTAGGGT 


TTTCTTCACT 


TCTTGCTTCT 


TTCCCCATTC 


2820 


CCTCATCCAC 


AAATAAGGGC 


ATCACAAGTC 


AGTCTCCTTT 


AAGCAGGCAG 


CTTTGGTGGG 


2880 


GTTTTTCCCC 


TGGAAGCCAG 


GGACC CTGTC 


AGGCTGCCTC 


TGCCTTGTGG 


TCAGGTTGAC 


2940 


AGGAGGTTGG 


AGGGAAAAGC 


CTTAAGTCAT 


GGGATTCTCA 


CCAGCTGTGT 


CTGGCTCAGA 


3000 


CCTGGAATGT 


GACCTTTATT 


TTGTTGTATT 


TGAACATTGT 


AAAGTGTGGG 


TGGTACCTTA 


3060 


AACTGAATAT 


GTGAAGAATC 


CAGAAACTGA 


CCAACAGCTT 


TCAGATACCT 


GGGGCTAGGT 


3120 


C AC T AAGGTC 


ACATCCAGTC 


TTCCCTACCC 


TGTTCTAGTT 


GTTAGCTACT 


ACCTCTCCCA 


3180 


GATAGATTGC 


TGTATATCCT 


CCAACTATGA 


TCATCCTGGC 


CCAAGCTTGC 


CTGTTCTTGA 


3240 


GTCTGTCTTA 


ACCAGTGGAA 


CTGCTGCCCT 


TGGTGTGCAG 


TGAGTTGAGG 


ACTCTTGGTC 


3300 


ACAGCCAGGC 


TCTAGTAGTA 


CAGCTCCTTT 


CTGCTGGTGC 


TGTATTTCCA 


TATCAAAAGG 


3360 


CACAGGGGAG 


ATCTAGAAAT 


GCCATCTCCC 


CCAGTCCATC 


AGTGCCAAAC 


AAGCCCATGA 


3420 


TCCCAGCATG 


GGTACAGACA 


ACTCTGTTCA 


GTGCTATCAC 


AACAGACTAG 


AGGCCATGAA 


3480 


CATTGGACGT 


GGGAACCAGA 


GCAACCCGAA 


TTGCTGCTGC 


TTTATTCAGC 


TTTCCGTTGC 


3540 


TCTGACAATG 


ATAAAACAAG 


GCAGTAACTT 


AAAACAGACT 


GCCAGGTTTG 


GCAGAGAAAG 


ioUU 


GAAATTCCTT 


AGCTGACAGC 


ACCTCTGGAT 


TTTAAATAGG 


TTGTAATAAG 


TGGCTCAAAC 


3660 


CCATCCAGGA 


AAAAGCAAAA 


GGGTTAGAAC 


TGACCAGATG 


AGACCAGCCT 


GATTTCATGC 


3720 


AGCCCAAATG 


GAGTCCAGCT 


GTCTGAACTC 


TGCAGCACTT 


CTCTAC TAC A 


GTCTCCTAGA 


3780 


GOATTCCAGC 


CAGGCTCTTC 


AGGCTGAGGA 


GACATCACAG 


GTGC CAGTTC 


TTCAAGAAGA 


3840 


CTTTTGTGCA 


TCAGTTCATA 


GCCTATATCT 


TTGCCCAAGA 


TTGTAGATTC 


AGGTT AACAC 


3900 
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TACAGATTCT 


AGGGCAGATG 


ACTGAGACTC 


AGAAAAAAAG 


CCCCTGTGGA 


CTGTGGTATA 


3960 


GCGAAGTACA 


AAAACTGAAG 


GGGGCTAGGG 


CAGATGCCGC 


ATGCCTCATG 


CCAGAGCCAA 


4020 


GCCCTCTGCT 


CCATCCACAT 


CCTTTTCTGG 


CTCCTTCTTC 


CTGCTCTCTG 


CTTCAGTGAA 


4080 


CCAGCCCCAC 


TCTGAAGAGA 


TTTGTTGATT 


CTCTCCATTT 


TTATGTCTTT 


CTCTTTTAGG 


4140 


TACTATATAG 


AAAAGGCTTA 


GTCTAATTGT 


TATAAATTGC 


TAGAATACTG 


CCTGCCCCAG 


4200 


GGTCTAAAAA 


TATATGCTAA 


AGGGGAAAAC 


TTGAACACTG 


AAACCAGTTC 


TGAACAATTT 


4260 


AGAAGGAAAA 


CCTTGAAAAC 


ATTTAACAAA 


AAATTATATT 


TTAATGTTTA 


TGAATAAGAG 


4320 


GAGGCTTTTG 


AAAAAATGTT 


GATCTATAAA 


TACTTACTTT 


AGGCCTGAGG 


TGTCTAATGA 


4380 


GTGAACTGAG 


CAATGGGAAC 


TCAAGGCTGA 


AGCCTCCTGC 


ATCAGAGGAG 


GTAGAACCAG 


4440 


GAGCCTCTTG 


AGATTTGAGG 


TGTTTTAGCA 


TTGGAAAGCC 


ACTCTTTGGG 


TAGCTGGCCC 


4500 


CAGAAACTAC 


TTCTGACCTT 


GTCATTTGGA ATGGAGGTTA 


GTGGTCTGCC 


AG ATGC C AAA 


4560 


GCTGCATGAG 


ACCAGCTCTT 


GGTTTATCAA 


TTTGAACACT 


CAGTAACCTA 


GAAGGCCCAG 


4620 


CACAAAGTGT 


CTGCTCTCTT 


CTTAACTGAG 


CCTGCCCCAG 


CACTACTGCA 


CAAATTAGGG 


4680 


AGGGTCTACT 


TCCTACAGAG 


CATCCCTCCC 


TGGGCCCCCT 


CCCATCCTTT 


GTACTCTACC 


4740 


TACCTGACCT 


TCAGGATCTT 


GGCACATACG 


AAATGGCTGT 


GTAGCAAGCA 


CTTTGGCATG 


4800 


CCCTCCTAAA 


CTTACCCCAG 


AGCCTCTCCC 


TGCCTCCTTA 


AGCCAGTCTG 


CCTGTCTTCT 


4860 


GGGGAGGTGT 


TAGAGCCCAT 


AGAATGGAGA 


GGAGAAAGAA 


AAGAGGAAGA 


GGCAGGCAGG 


4920 


TAGTAAAAAG 


GCTCTGGGAG 


GAAAGACAGC 


CTCCTAGGCT 


TTGCACAAGC 


AGGACTCAGC 


4980 


CCCTTGTGGG 


AACTAAGTGC 


CATCTTGGAG 


TTTAAGAACA 


TTTGGACAAG 


TTGCAAATGA 


5040 


CCTTTGCTCC 


TTGCTCC TCT 


CACCTTTTAT 


GGGGCCCTGC 


TTAGCACTGA 


AAGCAAATGC 


5100 


GCTGAAAAGG 


CAAAGAGGTT 


TGGCTCCTGC 


CCACTGATAG 


TCCTTTCCCT 


GCAGTGTTTG 


5160 


TGTGTCAAGT 


GGCAAAGCTG 


TTCTTCCTGG 


TGAC TCTGAT 


TAGATCCAGT 


AACTTAAGAG 


5220 


ATTTGTATGC 


ATAGGTCTGC 


TTTGACTCTT 


CTATTCTGGG 


CTTTTGATTT 


GTTTTTCAGT 


5280 


TTTGCTTTTA 


GTTTTCCTAT 


TTTTATTTTA 


TGCACCAACT 


AGACACACAA 


AGCAGTTGAA 


5340 


TTTATATATA 


TATATATATA 


TATATATCTG 


TATATTTCAC 


AATTATAAAC 


TCATTTTGCT 


5400 


TGTGACGCCA 


CACACACACA 


AAAAGAAAAA 


CCTTTTAAAA 


TTATACCTGT 


TGCTTAATTA 


5460 


CAATATTTCT 


GATAACCATA 


GAGTAGGACA 


AGGGAAAAAA 


TTTAAAAAAA 


AAAAAAAAAA 


5520 


AAGAAAAAAC 


ACATCTGTCT 


GCTGGTCACT 


TCTTCAATCC 


AAGCAGATCT 


GTGATCTTTC 


5580 


CTCGCGTCTT 


TCAAAGACTT 


CCCTGTGCTA 


AGTGAAGGAA 


GCTCCAGGCT 






TTTGTGCTTT 


GTTTCTCCTC 


TGTTGTGAAA 


GGGGCCCCAA 


GATTCTGGGT 


ACAGGACAGT 


5700 


TCATTTCAGC 


ATGGGGTCAG 


GAGACAAGAG 


CACTCCCTTT 


ACATGCTGAC 


GTACAGAACT 


5760 


TAGTGGGAAT 


AGCCTAGTCC 


CCACCTCTAG 


GGATGGGGAG 


CTAGCATGCA 


TGGGGGTGAC 


5820 


CCAACTCCCT 


CCACCTTTCC 


CTGGCCAGGA 


AGAGCCTGTG 


TACAGTAAGT 


CTGACAAGCT 


5880 


TTCCCCAGTT 


AGCAGGGCTC 


AGAGCATTTA 


AAAACCCTCC 


AAACTTTGCT 


GAGTCTAGGG 


5940 
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ACTAGAGAGA AGATAGAAGA TTTGGTCTAT CTCCAAGGTG TGTAAGCTGT ACCAGGTAGA 6000 

ATGCCAGGGA CCCCAGAACC ACATCCAACA GCCCAATGGG TCTCCTCCAG AAAGTAGTGA 6060 

AGACTCCAGA AACATCCCTT TCTCTTCTCC CTGCTCCCAT GAGTAACTGC ATTTGCTTTT 6120 

GTAATCCTTA ATGAGCATTA TCTGCTAAAA AAAAAAAATT AGCTGTAACA GTTCTTTTTG 6180 

CAAAAGGATC ATTCTTAAAT AATTAAAAAC ACCCCCCCCC CAAAAAAAAG TCCAGAACCT 6240 

TGTTCTTCCA AAGCAGAGAG CATTATAATC AGGGCCAAAA TCTGTCCCAC ACCTCTACCC 6300 

CATCTCCTCA TGATTGCTGC TTCTAAGGCC AGAATACAGC AAAGATATTT GTAGGCCCTT 6360 

TGGGTGACTG GGCTACCCTT GGAGCTCTTG GAAGATGGGC TGGGGAAGCC TCTGAGACCC 6420 

TATC CTAGGG CCTTGCTCTA GGGAGTAATC AGTATTAGTA GAGTGTCACA ACATTATTCC 6480 

CCAGCCGGCA TGAGATGGGG GCAGAAGAAG CCAAAGGGTT GTCTCCACTG C T AC TT AC TT 6540 

GGCCACTGAC AGGTAGGTGA CCATGTATGT CCATATGCAT GTTTTATGGC TGATGTGAGA 6600 

TCAGCACCCA AGTTAGCTTC ACCTGGTGAC CTCTAACCCT GCCTGGATGG AGCAGGCCAC 6660 

CTGGTTCAAT GTTTCTGGGC AGCTGGACAA TGGAGTGCAA AAGGCTTACA GAACTTGAAG 6720 

CCTTTTCCTT ACTTTGCTAG CACGGCCTCC TTTTCCATTT GATTTGTCAC TGCTTCAGTC 6780 

AATAACAGCC GCTCCAGAGT CAGTAGTTGA TGAATATATG ACCAAATATC ACCAGGACTG 6840 

TTACTCAACG TGTGCCGAGC CCTTTCCTTG TGCTGGGCTC CCTGTGTACC TGGACACTGT 6900 

AATGTGTGCT GTGTTTGCTC TCCTTCCTCT TCCTTCCTTG CCCTTTCCTT GTCTTTCTGG 6960 

GGTTTTTCTG TTGGGTTTGG TTTGGTTTTA TTTTTCCTTT TGTGTTCCAA ACATGAGGTT 7020 

TTCTCTACTG GTCCTCTTTA ACTGTGGTGT TGAGGCTTCT ATTTGTGTAA TTTTTGGTGG 7 080 

GTGAAAGGAA CTTTGCTAAG TAAATCTCTT CTGTGTTTGA AATGAAGTCT GTATTGTAAC 7140 

TATGTTTAAA GTAATTGTTC CAGAGACAAA TGCTTCTAGG TACATTTTCA TTACAAACAA 7200 

AGCATTTGAA GGGAGGGAAG TGGTGAATAA GACAAGAGGG GCAATCTGAA TTGATCCCTG 7260 

CCCAGATCAG CCAGAAGCTA CCAAAAGTTA AGCACTGGTT TTCCATTCCA AGTCAAGAGA 7320 

CTGAAGCTGA TGTTTTGCCA TTTTCAAAGT CAAAGCAAAA CCAGCTTTTC CACCCAATGG 7380 

ATTCTTTGCT TCTCCTTCCC AGATTATTAC TACTGCTGTA ATAATCTAGG AGTGCCAGGA 7440 

GGGAAAGGAG TATTAACACA GAGCTGTGCT CACTGAGTAT GGAAAGGCTT GGTCTGAGTT 7 500 

TTCAGGAGGA TGACCCACTG TGGACATGGG GAGAAGACAG AAGATAAATT AGCCGCTCCC 7560 

TGCCTAAGAT ACCTCTTAAT AGATAAGTCA AGGCCATGGA CATTATTGTC TACAAGGCAT 7 620 

GTTTCAAAGA CATGACCAGT CAGGACACTT CTGTCATACT CCATGTTGCC CCCTAGTACA 7680 

CAGTACTAAT CTGATATCTC TGTTCCCGCC ATGCCTGGGG GATAAAATGA TAGCAGAGAC 7740 

TCCTTTCCTT CAATGTGATC TAATTCCCAA CAAAATCTGG GCCTGAGATA CCACCTGTTT 7800 

CTATGGCAAA CATCCTCAGT AAAGTGTTAT TCTCATTGCA GATTGTTC C A GCCTAATGTA 7860 

AGAGGAACAG AGCAGTGTTC CCTTGGAGCC TCATGTGGAC AGTTCTACCT GTAGTGACCA 7920 

GTTGGC TATA GTAGTTATTA GCTGGAACAA CCAGACAGGG TACATGCCCC CTCCAAAATC 7980 
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CATGTTGTAC 


TCCCCTCTGC 


CAGCCAGGGG 


GGGTGAGATC 


TGTAGAATAG 


TGCAGCCAGT 


8040 


GACAAGCCAC 


CTTGTGTTTG 


TCACCAGCTC 


AAAAACTCAT 


CTAAGGTTGG 


GAGCAGGCAG 


8100 


ACAAGGCAGA 


GAGAAAGATC 


CAGGACAGAC 


CTAGCTGGGC 


TGGAGGGGTC 


TTGAAAAGCC 


8160 


CTCTGTCGTA 


TTCACCTTCA 


GTTTTTGTGC 


TTTGGGACAA 


TTACTTTAGA 


AAATAAGTAG 


8220 


GTCGTTTTAA 


AAACAAAATA 


TTGATTGCTT 


TTTTGTAGTG 


TTCAAAACAA 


AAGGTTCTTT 


8280 


GTGTATAGCC 


AAATGACTGA 


AAGCACTGAT 


ATATTTAAAA 


ACAAAAGGCA 


ATTTATTAAG 


8340 


GAAATTTGTA 


CCATTTCAGT 


AAACCTGTCT 


GAATGTACCT 


GTATACGTTT 


CAAAAACACA 


8400 


CCCCACTGAA 


CCCCTGTAAC 


CTATTTATTA 


TATAAAGAGT 


TTGCCTTATA 


AATTTACATA 


8460 


AAAA 












8464 



(2) ANGABEN ZU SEQ ID NO : 3: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 803 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: cDNA 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 3: 



TTGCTGCAGA 


TACTACTGAC 


CAGACAAGCT 


GTTGACCAGG 


CACCCCCCCA 


ATACTCCCCC 


60 


AATGTGCTCA 


TTAGAGATAG 


CAGTTGAGAG 


GACACTCCCA 


TTTTTGGTGC 


CCTGTCCATA 


120 


GCTTCCCTGA 


CTCTTCCACC 


ACCCCAACTC 


CCAATCTGAG 


GGACCGGGAG 


GTGCGAGGCA 


180 


GGAAAAATAT 


TGGATTCTTT 


AGAGAAGACT 


AGAGGTGACC 


AGTGACTGTG 


GCCCAGTAAT 


240 


TAGAACTGTG 


GTGGCACAAG 


TCTGGCCCCA 


CATCCACCCA 


ATCCAAAACT 


GATAAGGATA 


300 


TTTTGAAAAA 


CAGGAAAGCA 


GTACCTGTCT 


GATCCAGCTC 


TGGTATAGGT 


AGGAGTGAGT 


360 


CCTGAACTGC 


TGGATTACAG 


ACTGGCTTGA 


GCCACAGAAG 


ATGATGGACC 


AGAGTAAAGT 


420 


ATCATCACCT 


GCTCACAAGG 


CATGCTTCAC 


TAGAGAATAA 


TTCTAAAGAG 


GTGCCATGGA 


480 


GGCAGCAGGA 


CAAGGCACAA 


GCAGTCTGGG 


TGGGGGTCAA 


GCCAGACCTA 


GTGCCACAGA 


540 


ACAAGAGAGC 


AATCTGTGAC 


TAGTAGTTAG 


GGACTTTGTG 


GATGGGACAA 


GGGGCATGGG 


600 


GGAAGAAATG 


AAAATATTCT 


TCCAATTACT 


TTCCAGTTCT 


CCTTTAGGGA 


CAGCTTAGAA 


660 


TTATTTGCAC 


TATTGAGTCT 


TCATGTTCCC 


ACTTAAAAAC 


AAACAGATGC 


TCTGAAAGCA 


720 


AACTGGCTTG 


AAATGGTGAC 


ACTTTGTCCC 


ACAAGCCACC 


AAATGTGGCA 


GTGTTTAGAA 


780 


CTACCTGGAT 


CTGTATATAC 


CTG 








803 



(2) ANGABEN ZU SEQ ID NO: 4: 
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( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 790 Basenpaare 
<B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : cDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 



TTGCTGCATA 


TACTACTGAC 


CAGACAAGCT 


GTTTATCAGG 


CTTTTTAGGG 


TACACCAGCA 


60 


CCTGCCCTCC 


ATTCATCCCT 


GTTGGGAGAG 


GGATGGTGTA 


CTGGTTGTCA 


CTAGAGACCT 


120 


AACAGAGTAG 


GGTTAGTGGG 


AGCTTACATT 


TTCAGTGCCA 


TTAACATTCT 


AGTCCAAGGT 


180 


CTTAAATTAT 


TATGTTGAGG 


GGTTTTTTTT 


CCCCTGAGGG 


GGCCGGGGGG 


TGGGGGGAGG 


240 


GTTGATTAGA 


TTCCTTAGGA 


AAGAGGGTTG 


AGACAGACAG 


CAGAGCACTG 


AGCAGTTGGC 


300 


ACTAAAGGAG 


ACCTTGACTA 


GGGGCCAGGT 


GGCATCATCT 


AATCCCAAGG 


GGCTCCAAGT 


360 


GAGTATTAGG 


GTGGGGGAAG 


ACATTATAGA 


AGGAATAGAA 


ACAGGATAGC 


TCAGCCTAAA 


420 


GAAGAGCGGT 


TAAAACCCTA 


CCCACCAGGA 


GTTGACTTGA 


AAGAGGCCCC 


TATGGAGGAA 


480 


TCCCCAACCA 


CCAAAAGCAA 


TCTTGAGCTG 


CAGCTGCTTC 


ATTTAGTGGA 


CCTTGTGTAT 


540 


ATCTGGGTGT 


GTATGCACAT 


AGATAGACAG 


TGAGAAAGAA 


AACTGTTCTT 


CCAGTTCTTT 


600 


TCCAGTGCTA 


CTAGCTTAGG 


GACAGGTTAG 


AACTGTCTGC 


ACAATTGTGT 


GATCATTCCC 


660 


ATTCCCACTT 


CAAAACAAAC 


TGACTGAGAT 


GTTCAACAGA 


AAACTGGCTT 


CAATGGGTAA 


720 


CATGCCCTTG 


CCACTTACTT 


AAGACACTGG 


TGTGATGGGG 


TTTTGAACTC 


CCTATATTTG 


780 



TAGGTATCTG 7 90 

(2) ANGABEN ZU SEQ ID NO: 5: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 841 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKOLS : cDNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

TTGCTGCAGA TACTACTGAC CAGACAAGCT GTTGACCAGG CACCTCCCCT CCCGCCCAAA 60 

CCTTTCCCCC ATGTGGTCGT TAGAGACAGA GCAGTTGAGA GGACACTCCC GTTTTCGGTG 120 

CCATCAGTGC CCCGTCTACC ACTCCCCCAG CTCCCCCCAC CTCCCCCACT CCCAACCACG 180 

TTGGGACAGG GAGGTGTGAG GCAGGAGAGA CAGTTGGATT CTTTAGAGAT GGATGTGACC 240 
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AGTGGCTATG 


GCCCGTGCGA 


TCCCACCCGT 


GGCGGCTCAA 


ATCTGGCCCC 


ACCCCAGCCC 


300 


CAATCCAAAA 


CTGGCAAGGA 


CGCTTCACAG 


GACAGGAAAG 


TGGCACCTGT 


CTGTTCCGGC 


360 


ATGGCTAGGA 


GGGAGTTGTC 


CCTTGAACTA 


CTGGGTGTAG 


ACTGGCCTAA 


ATCACAGGAG 


420 


AGGATGGCCC 


AGGGTGAGGT 


GGCATGGTCC 


ATTCTCAAGG 


GACGTCCTCC 


AGTTGGTGGC 


480 


ACTAGAGAGG 


CCATGGAGGC 


AGTAGGACAA 


GGCACAGGCA 


GGCTGGCCCA 


GGGTCAGGCC 


540 


GGGCCGAACA 


CAGCGGGGTG 


AGAGGGATTC 


CTCGTCTCAG 


AGCAGTCTGT 


GACCGGTAGT 


600 


TAGGGACTTA 


GTGGACAGGG 


AAGGGGCAAA 


GGGGGAGGAG 


AAGAAAATGT 


TCTTCCAGTT 


660 


ACTTTCCAAT 


TCTACTCCTT 


TAGGGACAGC 


TTAGAATTAT 


TTGCACTATT 


GAGTCTTCAT 


720 


GTTCCCACTT 


CAAAACAAAC 


AGATGCTCTG 


AGAGCAAACT 


GGCTTGAATT 


GGTGACGTTT 


780 


AGTCCCTCAG 


GCCACCAGAT 


GTGATGGTGT 


TGAGAACTAC 


CTGGATATGT 


ATATATACCT 


840 



G 841 



(2) ANGABEN ZU SEQ ID NO: 6: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 846 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : cDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 



TTGCTGCAGA 


TACTACTGAC 


CAGACAAGCT 


GTTGACCAGG 


CACCTCCCCT 


CCCGCCCAAA 


60 


CCTTTCCCCC 


ATGTGGTCGT 


TAGAGACAGA 


GCAGTTGAGA 


GGACACTCCC 


GTTTTCGGTG 


120 


CCATCAGTGC 


CCCGTCTGCA 


GCTCCCCCAG 


CTCCCCCCAC 


CTCCCCCACT 


CCCAACCACG 


180 


TTGGGACAGG 


GAGGTGTGAG 


GCAGGAGAGA 


CAGTTGGATT 


CTTTCGAGAA 


GATGGATATG 


240 


ACCAGTGGCC 


ATGGCCTGTG 


CGATCCCACC 


CGTGGCGGCT 


CAAGTCTGGC 


CCCACACCAG 


300 


CCCCAATCCA 


AAACTGGCAA 


GGACGCTTCA 


CAGGACAGGA 


AAGTGGCACC 


TGTCTGCTCC 


360 


AGCTCTGGCA 


TGGCTAGGAG 


GGAGTCGTCC 


CTTGAACTAC 


TGGGTGTAGA 


CTGGCCTGAA 


420 


CCACAGGAGA 


GGATGGCCCA 


GGGTGAGGTG 


GCATGGTCCA 


TTCTCAAGGG 


ACGTCCTCCA 


480 


ACGGGTGGCG 


CTAGAAAGGC 


CATGGAGGCA 


GTAGGACAAG 


GCGCAGGCAG 


GCTGGCCCGG 


540 


GGTCAGGCCG 


GGCAGGGCAC 


AGCGGGGTGA 


GAGGGATTCC 


TAATCACTCA 


GAGCAGTGTG 


600 


TGACTGGTAG 


TTAGGGACTC 


AGTGGACAGG 


GGAGGGGCGA 


GGGGGCAGGA 


GAAGAAAATG 


660 


TTCTTCCAGT 


TACTTTCCAA 


TTCTCCTTTA 


GGGACAGCTT 


AGAATTATTT 


GCACTATTGA 


720 


GTCTTCATGT 


TCCCACTTCA 


AAACAAACGA 


TGCTCTGAGA 


GCAAACTGGC 


TTGAATTGGT 


780 


GACATTTAGT 


CCCTCAAGCC 


ACCAGATGTG 


AGTGTTGAGA 


ACTACCTGGA 


TTTGTATATA 


840 



13 

TACCTG 846 



(2) ANGABEN ZU SEQ ID NO: 7: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 813 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: cDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 



TTGCTGCAGA 


TACTACTGAC 


CAGACAAGCT 


GTTGACCAGG 


CACTCCCCAC 


AACAACAACC 


60 


CCGTCCCTCC 


TCACCCCACC 


CCTATCCCCT 


GTGTGCTCAT 


TAGAGAGGGC 


AATTGAGAGG 


120 


ACACTCCCAT 


TTTTGGTGCC 


ACTGATGCCC 


TGTCCATAGC 


TTCCCTGACT 


TTTACACCAC 


180 


CCCAACTCCC 


AATCTGAGGG 


ACTGGGAGGT 


GTGACGCAGG 


AGAAACTATA 


T AGG AC TCTT 


240 


GGGAGAAGAC 


TATAGAGTTG 


GCAAGTGATT 


GCGCCCCAGT 


AATTCCAACT 


GTGGTAGCAC 


300 


AAGTCTGGCT 


CCACACCAAC 


CCAATCCAAA 


ACTGACAAGG 


ACATTTTGCA 


AAAAATGAAA 


360 


GTGGCATTTG 


TCTGATCCAG 


CTCTGGCATG 


GCTAGAGATG 


AGTCTTAAAC 


TGTTGGCTTA 


420 


TAAACTGGCC 


TGAGCAACAG 


AAGAGGATGG 


CCCAGAGTAA 


AGTGTCATCA 


TCTGTTCACA 


480 


AGGCATGCTC 


CCCTAGAAGT 


TCATGCTAAA 


GAAGTGCCAT 


GGAGGCAGCA 


GGAGAAAGTA 


540 


CAGGCTAGGT 


GGAGTCAAGC 


CAGGCCTAGT 


GCCACAGAGC 


AAGAGAGCAG 


TCTCTGACTA 


600 


GTAGTTAAGG 


GGGAAGAAAG 


AAAAATATTC 


TTCCAATTGC 


TTTCCAGTTC 


TCCTTTAGGG 


660 


ACAGCTTAGA 


ATTATTTGCA 


CTATTGAGTC 


TTCATGTTCC 


CACTTCAAAA 


CAAATAGATG 


720 


CTCTGAAAGC 


AAACTGGCTT 


GAAATGGTGA 


CACTGTCCCA 


CAAGCCACCA 


GACAATGGCA 


780 


GTGTTCAGAA 


CTACC TGT AT 


ATGTATATAC 


CTG 






813 



(2) ANGABEN ZU SEQ ID NO: 8: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 842 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: nicht bekannt 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKOLS: cDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 
TTGCTGCAGA TACTACTGAC CAGACAAGCT GTTGACCAGG 
CCTTTCCCCC ATGTGGTCGT TAGAGACAGA GCGACAGAGC 



CACCTCCCCT 
AGTTGAGAGG 



CCCGCCCAAA 
ACACTCCCGT 



60 
120 
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TTTCGGTGCC 


ATCAGTGCCC 


CGTCTACAGC 


TCCCCCAGCT 


CCCCCCACCT 


CCCCCACTCC 


180 


CAACCACGTT 


GGGACAGGGA 


GGTGTGAGGC 


AGGAGAGACA 


GTTGGATTCT 


TTAGAGAAGA 


240 


TGGATATGAC 


C AGTGGC TAT 


GGCCTGTGTG 


ATCCCACCCG 


TGGTGGCTCA 


AGTCTGGCCC 


300 


CACACCAGCC 


CCAATCCAAA 


ACTGGCAAGG 


ACGCTTCACA 


GGACAGGAAA 


GTGGCACCTG 


360 


TCTGCTCCAG 


CTCTGGCATG 


GCTAGGAGGG 


GGGAGTCCCT 


TGAACTACTG 


GGTGTAGACT 


420 


GGCCTGAACC 


ACAGGAGAGG 


ATGGCCCAGG 


GTGAGGTGGC 


GTGGTCCATT 


CTCAAGGGAC 


480 


GTCCTCCAAC 


GGGTGGCGCT 


AGAGGCCATG 


GAGGCAGTAG 


GACAAGGCGC 


AGGCAGGCTG 


540 


GCCCGGGGTC 


AGGCCGGGCA 


GAGCACAGCG 


GGGTGAGAGG 


GATTCCTAAT 


CACTCAGAGC 


600 


AGTCTGTGAC 


TTAGTGGACA 


GGGGAGGGGG 


CAAAGGGGGA 


GGAGAAGAAA 


ATGTTCTTCC 


660 


AGTTACTTTC 


CAATTCTCCT 


TTAGGGACAG 


CTTAGAATTA 


TTTGCACTAT 


TGAGTCTTCA 


720 


TGTTCCCACT 


TCAAAACAAA 


CAGATGCTCT 


GAGAGCAAAC 


TGGCTTGAAT 


TGGTGACATT 


780 


TAGTCCCTCA 


AGCCACCAGA 


TGTGACAGTG 


TTGAGAACTA 


CCTGGATTTG 


TATATATACC 


840 


TG 












842 
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